Prévia do material em texto
Unidade 2 Livro Didático Digital Adauto José Valentim Neto e Dayanna Costa Estatística Básica Diretor Executivo DAVID LIRA STEPHEN BARROS Gerente Editorial CRISTIANE SILVEIRA CESAR DE OLIVEIRA Projeto Gráfico TIAGO DA ROCHA Autor ADAUTO JOSÉ VALENTIM NETO E DAYANNA COSTA OS AUTORES Adauto José Valentim Neto e Dayanna Costa Olá. Somos Adauto José Valentim Neto e Dayanna Costa. Eu, Adauto, sou formado em Administração, Comércio Exterior e Business Administration, além de bacharelando em Direito, com uma experiência técnico-profissional na área de Administração de Empresas. Passei por empresas da área de educação superior, nas quais lecionei, e sou apaixonado pelo que faço e adoro transmitir minha experiência de vida àqueles que estão iniciando em suas profissões. Eu, Dayanna, sou formada em Administração pela Universidade Federal de Campina Grande (UFCG) e tenho Mestrado acadêmico nessa mesma área de conhecimento, com ênfase em Estratégia e Inovação, pela Universidade Federal da Paraíba. Também possuo mestrado acadêmico em Gestão de Recursos Naturais (UFCG) com ênfase de pesquisa em Estratégia Ambiental focada em modelos e ferramentas de gestão na empresa, tendo experiência técnico-profissional no ensino da Administração ao ministrar disciplinas como Marketing, Planejamento Estratégico, Cultura organizacional e liderança e Administração de Recursos Materiais e Patrimoniais a níveis de graduação e pós-graduação. Eu sou apaixonada por Gestão de Atendimento ao Cliente, e lecionar esse conteúdo, para mim, consiste em emergir, junto dos discentes, em um universo de possibilidades de gestão, técnicas e práticas dentro do contexto de atuação dos futuros profissionais em formação. Adoro transmitir meus conhecimentos e minha experiência de vida àqueles que estão iniciando em suas profissões. Por isso, fomos convidados pela Editora Telesapiens a integrar seu elenco de autores independentes. Estamos muito felizes em poder ajudar você nesta fase de muito estudo e trabalho. Conte conosco! ICONOGRÁFICOS Olá. Esses ícones irão aparecer em sua trilha de aprendizagem toda vez que: INTRODUÇÃO: para o início do desenvolvimento de uma nova compe- tência; DEFINIÇÃO: houver necessidade de se apresentar um novo conceito; NOTA: quando forem necessários obser- vações ou comple- mentações para o seu conhecimento; IMPORTANTE: as observações escritas tiveram que ser priorizadas para você; EXPLICANDO MELHOR: algo precisa ser melhor explicado ou detalhado; VOCÊ SABIA? curiosidades e indagações lúdicas sobre o tema em estudo, se forem necessárias; SAIBA MAIS: textos, referências bibliográficas e links para aprofundamen- to do seu conheci- mento; REFLITA: se houver a neces- sidade de chamar a atenção sobre algo a ser refletido ou dis- cutido sobre; ACESSE: se for preciso aces- sar um ou mais sites para fazer download, assistir vídeos, ler textos, ouvir podcast; RESUMINDO: quando for preciso se fazer um resumo acumulativo das últi- mas abordagens; ATIVIDADES: quando alguma atividade de au- toaprendizagem for aplicada; TESTANDO: quando o desen- volvimento de uma competência for concluído e questões forem explicadas; SUMÁRIO Distribuição de frequências ....................................................................10 Distribuição de frequências ................................................................................................... 10 Passo a passo para elaboração da distribuição de frequência .................... 13 Elementos da distribuição de frequências .....................................17 Classes .................................................................................................................................................... 17 Limites de classe ............................................................................................................................. 18 Intervalo de classe ......................................................................................................................... 19 Amplitude total da distribuição ........................................................................ 19 Amplitude amostral .................................................................................................. 20 Ponto médio de uma classe .................................................................................................. 20 Identificação dos elementos de uma distribuição de frequência ............... 21 Tipos de distribuição de frequências .................................................25 Entendendo os tipos de distribuição de frequência .............................................25 Frequência simples ou absoluta .......................................................................25 Frequência relativa ......................................................................................................27 Frequência acumulada ...........................................................................................29 Aplicação das frequências relativa e acumulada ................................29 Gráficos de distribuição de frequência ..............................................33 Os gráficos ..........................................................................................................................................33 Histograma de frequência ........................................................................................................34 Construindo um histograma de frequência ............................................35 Polígono de frequência ..............................................................................................................37 Construindo um polígono de frequência .................................................. 38 7 UNIDADE 02 Estatística Básica 8 INTRODUÇÃO Você sabia que a área estatística é uma das mais demandas no mercado e é responsável pela geração de muitas informações utilizadas para tomadas de decisões nas diversas áreas do conhecimento? Isso mesmo. A área da estatística faz parte da área da matemática que estuda o comportamento dos elementos que compõem o nosso cotidiano. Para isso, vamos estudar como é feita a organização dos dados após sua coleta por meio da distribuição das frequências, como essa distribuição é realizada e, ainda, quais são os elementos necessários para a construção de uma frequência, de maneira que os dados fiquem organizados e claros. Além disso, vamos estudar os tipos de frequências que podem compor uma tabela, para isso, temos a frequência simples ou absoluta, a frequência relativa e a frequência acumulada, cada uma gerando informações que auxiliam os usuários na construção de informações relevantes. Por fim, compreenderemos como se dá a representação gráfica desses dados por meio do histograma e do polígono de frequência. Assim, sua principal responsabilidade é compreender os aspectos básicos e introdutórios da estatística, entendeu? Ao longo desta unidade letiva, você vai mergulhar neste universo! Estatística Básica 9 OBJETIVOS Olá. Seja muito bem-vindo à Unidade 02. Nosso objetivo é auxiliar você na compreensão dos seguintes tópicos até o término desta etapa de estudos: 1. Distribuição de frequências; 2. Elementos da distribuição de frequências; 3. Tipos de distribuição de frequência; 4. Gráficos de distribuição de frequência. “O sucesso nasce do querer, da determinação e persistência em se chegar a um objetivo. Mesmo não atingindo o alvo, quem busca e vence obstáculos, no mínimo fará coisas admiráveis” – José de Alencar Estatística Básica 10 Distribuição de frequências INTRODUÇÃO: Ao término deste capítulo, você será capaz de entender como funciona a distribuição de frequência, e isso será fundamental para o exercício da sua profissão. Muitas das dificuldades das pessoas estão relacionadas ao modo de organizar e interpretaros dados coletados nas pesquisas ou no cotidiano, pela sua quantidade ou pelo poder informativo que podem gerar. Assim, neste capítulo, vamos compreender um pouco mais como executar isso. E então? Motivado para desenvolver essa competência? Então, vamos lá! Distribuição de frequências Para entendermos como ocorre a distribuição de frequência, é relevante sabermos que a distribuição contém um número adequado de classes. Nesse sentido, a perda de detalhes pode acontecer, e caso o número de classes seja menor, acarretará possível perda de informação, a qual será extraída da tabela. Entretanto, caso ocorra o inverso, se o número de classes for maior, ou seja, em excesso, poderá ocorrer alguma frequência nula ou muito pequena. Dessa forma, não atingirá o objetivo da sua classificação, o que torna o conjunto de dados supervisionáveis. Figura 1 – Coleta de dados Fonte: Freepik (2015). Estatística Básica 11 Anteriormente, aprendemos que existem várias maneiras de se coletar dados. Geralmente, esses dados são trabalhados por pesquisadores, que transformam dados amostrais a partir de populações definidas. Como iniciamos nossos estudos, precisamos compreender que dependemos do volume de dados. Nessa perspectiva, a compreensão de que são difíceis ou impraticáveis as conclusões advindas do comportamento das variáveis e, em particular, de variáveis quantitativas, deve partir da pessoa que analisar os dados. No entanto, os dados brutos de cada variável quantitativa podem ser organizados em ordem crescente ou decrescente, que é chamado de rol. A visualização de qualquer padrão ou comportamento ainda é difícil de observar ou mesmo cansativo para o pesquisador, mas no caso de variáveis quantitativas, valores maiores e menores ou concentração de valores podem ser identificados de forma rápida. Assim, esses números, que podem ser observados de forma baixa e mais alta, são usados como ponto de partida para a construção dessas tabelas de variáveis. Vale ressaltarmos que, para as variáveis qualitativas, por exemplo, também é possível construir uma lista em ordem cronológica ou alfabética. DEFINIÇÃO: Para Larson e Betsy (2015, p. 37), uma distribuição de frequência é uma tabela que mostra classes ou intervalos dos valores com a contagem do número de ocorrências em cada classe ou intervalo. A frequência f de uma classe é o número de ocorrências de dados na classe. Podemos, assim, exemplificar uma distribuição de frequência da seguinte forma: suponha que os dados a seguir representam as idades das 50 mulheres que participam de um grupo de xadrez. 25, 31, 35, 37, 43, 43, 43, 44, 45, 47, 48, 48, 49, 50, 51, 51, 51, 51, 52, 54, 54, 54, 54, 55, 55, 55, 56, 57, 57, 57, 58, 58, 58, 58, 59. 59, 59, 62, 62, 63, 64, 65, 65, 65, 66, 66, 67, 67, 72, 83. Estatística Básica 12 A partir desses dados, vamos aprender as formas de organizar e descrever os conjuntos de dados, os quais podem ser coletados das mais diversas formas, como já estudamos anteriormente. Nesse sentido, o objetivo é entender os dados de forma mais fácil, descrevendo, assim, as tendências, as medidas centrais e as variações. Como no exemplo, os dados brutos mostram as idades das 50 mulheres que participam de um grupo de xadrez, e não é fácil vermos um padrão ou uma característica em especial. Tabela 1 – Distribuição de frequência Classe Frequência (f) 25 - 34 2 35 - 43 5 44 - 52 12 53 - 61 18 62 - 70 11 71 - 79 1 80 - 83 1 Fonte: Elaborado pelos autores. Você aprenderá que existem muitas maneiras de organizar e descrever conjuntos de dados. Algumas características importantes que devem ser consideradas ao se organizar e descrever um conjunto de dados são o seu centro, a sua variabilidade (ou dispersão) e a sua forma. Quando o conjunto de dados tem muitos valores, o padrão pode ser difícil de observar. Nesta seção, você aprenderá como organizar o conjunto de dados, agrupando-o em intervalos chamados classes e formando uma distribuição de frequência, bem como a usar a distribuição de frequência para gráficos. Nesse sentido, quanto à distribuição de frequência mostrada na Tabela 1, vemos sete classes. As frequências para cada uma das sete classes são 2, 5, 12, 18, 11, 1 e 1. Cada classe tem um limite inferior de classe, que é o menor número que pode pertencer à classe, e um limite Estatística Básica 13 superior de classe, que é o maior número que pode pertencer à classe. Na distribuição de frequência estudada, os limites inferiores de classe são 25, 35, 44, 53, 62, 71 e 80, e os limites superiores de classe são 34, 43, 52, 61, 70, 79 e 83. A amplitude de classe é a distância entre os limites inferiores (ou superiores) de classes consecutivas. Por exemplo, a amplitude de classe na distribuição de frequência mostrada é 7 – 1 = 6. Note que as classes não se sobrepõem. O passo a passo para a elaboração de uma distribuição de frequência será estudado a seguir. Passo a passo para elaboração da distribuição de frequência Suponha que você possui um conjunto de dados que se refere a 30 aparelhos de barbear portáteis, pesquisados e anotados por você. Com eles, vamos construir uma distribuição de frequência com sete classes. 128 100 180 150 200 90 340 105 85 270 200 65 230 150 150 120 130 80 230 200 110 126 170 132 140 112 90 340 170 190 Em primeiro lugar, definimos o número de classes que farão parte de nossa tabela. Neste caso, como já definido anteriormente, o número de classes será sete. Em seguida, vamos identificar o valor mínimo e o valor máximo que pertencem aos dados expostos. No caso, como número mínimo, temos o valor 65, e como número máximo, temos o valor de 340. Logo, podemos calcular a amplitude dessa distribuição, que se dá por meio do valor máximo menos o valor mínimo. Assim, a amplitude é de 340 – 65 = 275. Após a definição da amplitude, devemos calcular a amplitude da classe, de forma que vamos dividir a amplitude encontrada (275) pelo número de classes da distribuição, que é sete. Dessa forma, a amplitude da classe será ou, mais precisamente, o valor 40, que é mais conveniente para os dados. Estatística Básica 14 No momento seguinte, no quarto passo, precisaremos definir o valor do limite inferior, que será conveniente para as classes. Assim, para a definição desses valores, pegaremos o valor da amplitude da classe, que, neste caso, foi 40. Dessa forma, a primeira classe terá um limite inferior de 65 (menor número dos dados), já a segunda classe será calculada assim: 65 + 40 = 105, que será seu limite inferior; a terceira classe, por sua vez, terá um limite inferior de: 105 + 40 = 145, e assim deve ser feito com as demais classes. Entretanto, para o cálculo do limite superior, precisamos dos valores anteriormente calculados. Assim, o limite superior da primeira classe será 104, ou seja, o limite inferior da classe seguinte menos 1. O limite superior da segunda classe será 145 – 1 = 144, e assim por diante, em todas as classes. Assim, os limites inferiores e superiores dessa distribuição ficaram da seguinte forma: Classes Limites Inferiores Limites Superiores 1ª 65 104 2ª 105 144 3ª 145 184 4ª 185 224 5ª 225 264 6ª 265 304 7ª 305 344 Após a definição dos limites inferiores e superiores, precisamos, agora, fazer a contagem de cada registro de dados, ou seja, contar quantas vezes os números se repetem de acordo com cada intervalo de classe. Dessa forma, na primeira classe, temos o intervalo de 65 – 104, logo, existem 6 números em nossos dados coletados nesse intervalo. O valor 128, por sua vez, está na segunda classe, entre 105–144, então, as marcas de contagem nessa classe totalizaram 9, e assim por diante, em todos os intervalos da classe. Dessa forma, denominamos essas contagens de frequência (f). Estatística Básica 15 Classes Distribuição das classes Contagens 1ª 65 - 194 |||||| 2ª 105 - 144 |||||||||3ª 145 - 184 |||||| 4ª 185 - 224 |||| 5ª 225 - 264 || 6ª 265 - 304 | 7ª 305 - 344 || Nessa perspectiva, após essa contagem, definimos os valores (numéricos) da frequência da classe. Então, a primeira classe terá uma frequência de 6, a segunda classe de 9 e assim por diante, de acordo com a contagem que fizer. A soma das frequências será denominada por Σf, em que Σ é a letra grega maiúscula chamada de sigma. Assim, a distribuição dessa frequência se apresentará de forma completa da seguinte forma: Classes Distribuição das classes Frequência (f) 1ª 65 - 194 6 2ª 105 - 144 9 3ª 145 - 184 6 4ª 185 - 224 4 5ª 225 - 264 2 6ª 265 - 304 1 7ª 305 - 344 2 Σf = 30 Finalmente, conseguimos distribuir os dados que foram coletados em relação aos valores dos 30 aparelhos de barbear portáteis que você pesquisou. Por meio dessa estrutura, podemos perceber que o somatório das frequências é exatamente a quantidade de dados que foram coletados, de forma que, agora, estão ordenados e mais acessíveis para interpretações. Estatística Básica 16 Assim, podemos concluir que a maioria dos valores dos aparelhos está entre 65 e 184, pois são os valores que mais se repetem na distribuição das frequências. Portanto, muitas informações podem ser ordenadas e organizadas de forma a auxiliarem o pesquisador nas interpretações e nas análises dos dados coletados. No nosso exemplo, foi uma amostra de 30 valores, mas existe a possibilidade de haver inúmeras coletas e inúmeros tamanhos de informações que podem tornar impossível o cálculo de forma manual. Como estudado anteriormente, tais informações e dados podem ser analisados por meio de softwares que auxiliam na organização desses dados. RESUMINDO: E então? Você gostou do que apresentamos? Conseguiu apreender tudo? Agora, só para termos certeza de que você realmente entendeu o tema de estudo deste capítulo, vamos resumir tudo o que vimos. Você deve ter aprendido que, para conhecer a distribuição de frequência, é importante o conhecimento prévio dos dados e de como eles foram coletados, como estudamos na unidade anterior. Em seguida, deve ter compreendido que a distribuição de frequência consiste na técnica de ordenar os dados, que são distribuídos em intervalos e aglomerados por classes; a partir de então, essas informações são contadas e descritas, sendo denominadas de frequência (f). Você também pôde ver, por meio do passo a passo, como elaborar uma tabela de distribuição de frequência, em que são calculados a amplitude das classes e os limites inferiores e superiores das classes; bem como pôde fazer a contagem dos dados, a identificação da frequência e determinar o somatório das frequências, de forma a se igualar ao número de dados anteriormente coletados. Com isso, espero que você tenha compreendido como a estatística pode ser importante no nosso cotidiano e como ela pode nos auxiliar na geração de informações relevantes. Estatística Básica 17 Elementos da distribuição de frequências INTRODUÇÃO: Ao término deste capítulo, você será capaz de entender quais são os elementos necessários para uma distribuição de frequência, e isso será fundamental para o exercício de sua profissão. Os elementos aqui estudados serão fundamentais para a construção de uma tabela que organizará os dados por meio de uma distribuição e suas frequências. E então? Motivado para desenvolver essa competência? Então, vamos lá! Classes Classe é o intervalo de variável ou entre variáveis. As classes são representadas simbolicamente por i, em que i = 1, 2 [...] K, em que k é o número total de classes. O número total de valores é representado por n. Figura 2 – Classes de dados Fonte: Freepik (2020). Por exemplo, podemos supor que exista uma variável que assume 50 valores. Dessa forma, n = 50, as classes serão definidas a partir dos intervalos e das amplitudes que serão calculadas a partir dos dados. Com isso, podemos definir que a primeira classe será i = 1; a segunda será: i = 2; Estatística Básica 18 a terceira será: i = 4 e assim por diante, até o limite de classe definida de sua amostra. Limites de classe As extremidades de cada uma das classes em uma distribuição de frequência são denominadas limites de classe. Nesse sentido, já que a classe é representada por i, o limite considerado inferior será representado por li, já o limite superior será representado por Li. Assim, ao avaliarmos o exemplo do capítulo 1, definimos que o limite inferior (l2), ou seja, da segunda classe, é de 105, e que o limite superior (L2) é de 144. Dessa forma, os limites das classes (i) são representados dessa forma: li Limite inferior da classe. Li Limite superior da classe. Como estudamos anteriormente, o cálculo do limite inferior se dá por meio da identificação da amplitude da classe. Logo, o limite inferior da primeira classe será o menor número identificado nos dados coletados, e a partir da segunda classe, o limite inferior será calculado: limite inferior da primeira classe (i=1) + amplitude da classe; o limite inferior da terceira classe (i=3): limite inferior da segunda classe (i=2) + amplitude da classe; e assim sucessivamente, até o número de classes definidos em sua pesquisa. Quanto ao cálculo do limite superior, também já observado anteriormente, pegamos o valor do limite inferior da classe seguinte e deduzimos um: limite superior da primeira classe (i=1): limite inferior (i=2) – 1; limite superior da segunda classe (i=2): limite inferior (i=3) – 1; e assim sucessivamente, até a última classe, em que o limite superior será o maior valor dos dados analisados. Estatística Básica 19 Intervalo de classe Como já estudado, o intervalo de classe ou a amplitude de um intervalo de classe consiste no tamanho do intervalo que definirá a classe. Nesse sentido, o intervalo da classe será simbolizado por (hi), que será obtido a partir da diferença entre os seus limites, ou seja: hi = Limite superior (Li) – Limite inferior (li). No exemplo que usamos, no capítulo anterior, o tamanho do intervalo da segunda classe (h2) será calculado da seguinte forma: h2 = L2 − l2 144 − 105 39, como discutimos anteriormente. Nessa perspectiva, todas as outras classes (i) também vão obter o mesmo intervalo entre os limites. O intervalo da classe, de maneira geral, pode ser calculado a partir da identificação dos limites gerais. Assim, . Substituindo as informações de acordo com exemplo utilizado, vamos observar que: . Amplitude total da distribuição Nessa perspectiva, vamos estudar a amplitude total da distribuição (AT), que consiste no intervalo total compreendido por todas as classes da distribuição, ou seja, será compreendido desde o limite inferior da primeira classe (l1) até o limite superior da última classe (Lk). Transformando em fórmula matemática, temos: AT = Lk − l1. O cálculo dessa diferença, entre o menor e o maior valor observado da variável, definirá a construção de uma distribuição de frequência em classes. Quando observamos o exemplo do capítulo anterior, percebemos que temos sete classes (k = 7), logo, o limite superior da última classe (i = 7) corresponde a L7 = 344, enquanto o limite inferior da primeira classe (i = 1) equivale a l1 = 65. Desse modo, a amplitude total será determinada assim: AT = L7 − l1 = 344 − 65 = 279. Estatística Básica 20 Com isso, na distribuição em que as classes possuem o mesmo intervalo, a amplitude total também pode ser calculada a partir da multiplicação do intervalo de classe e o número de classes, como: AT = hi x k. Assim, considerando o nosso exemplo, temos: AT = 39 x 7 279, lembrando que os valores são aproximados, devido à consideração das casas decimais no momento do cálculo. Amplitude amostral Considerando os nossos estudos sobre a amplitude, vamos compreender, a partir de agora, o que é amplitude amostral (AA). Essa amplitude consiste no intervaloentre o maior valor (max(x)) e o menor valor (min(x)) dos dados contidos na amostra estudada. Logo, tal equação se dá da seguinte forma: AA = max(x) − min(x). Considerando, mais uma vez, o exemplo do capítulo anterior, percebemos que o maior preço dos aparelhos pesquisados foi de 344, já o menor foi de 65, logo, a nossa amplitude total: AA = 344 − 65 = 279. Podemos perceber que, nessa situação, a amplitude amostral coincide com a amplitude total da distribuição, em que ambos obtêm o valor de 279. Ponto médio de uma classe Por fim, mas não menos importante na distribuição de frequência, temos o ponto médio de uma classe, que consiste em identificar o ponto que divide a classe ao meio. DEFINIÇÃO: Larson e Betsy (2015) definem que o ponto médio de uma classe é o somatório dos limites inferior e superior da classe dividida por dois. Assim, o ponto médio, por algumas vezes, pode ser denominado de marca da classe ou representante da classe. Assim, podemos formular que o ponto médio será: ponto médio = limite inferior da classe (li) + limite superior da classe (Li) / 2. Estatística Básica 21 Nessa perspectiva, podemos simbolizar o ponto médio da classe por (xi) e calculá-lo efetuando-se a média entre os limites da classe. Considerando também o exemplo do capítulo anterior, podemos encontrar o ponto médio da segunda classe da seguinte forma: Com essa informação, podemos definir que o ponto médio de uma classe é o seu valor representativo da classe, pois é quando partimos ao meio os dados contidos em uma classe (i). Identificação dos elementos de uma distribuição de frequência Para que possa compreender os elementos da distribuição de frequências e como eles podem auxiliar o pesquisador a montar e organizar os dados, vamos seguir um passo a passo para o cálculo de cada um dos elementos estudados neste capítulo. Com isso, vamos supor que foram coletados, em uma escola, a estatura, em cm (centímetros), de 40 alunos de uma turma. Assim, os dados são: 115 117 120 122 123 126 128 128 130 130 132 133 135 136 136 137 138 139 140 142 145 145 146 147 148 151 151 152 153 155 156 156 157 158 158 159 160 161 162 163 A partir desses dados, vamos iniciar nossos cálculos determinando o número de classes (i) que devem compor nossa distribuição de frequências. Logo, podemos considerar que seis é um número ideal de classes (i) para esse exemplo. Em seguida, vamos calcular a amplitude amostral (AA) dos dados, que consiste na identificação dos valores máximo (máx.(x)) e mínimo (min(x)) da amostra. Com base nos dados do exemplo, percebemos que o máx.(x) será de 163 e o min(x) será de 115. Logo: Estatística Básica 22 AA = máx.(x) - min(x) AA = 163 – 115 = 48 cm. Podemos afirmar, ainda, que a amplitude total dessa distribuição também será de 48 cm, visto que a amplitude total (AT) é calculada a partir do limite superior da última classe (L7), igual a 163, menos o limite inferior da primeira classe (l1), que é 115. Identificada a amplitude amostral ou total, temos que identificar os limites das classes, considerados, em nossos estudos, como Limite inferior (li) e Limite superior (Li). Mas para a definição desses valores, precisamos saber o intervalo das classes (hk). Assim, o intervalo das classes (hk) será definido da seguinte forma: Logo, o intervalo entre as classes deve ser de 8. Assim, em primeiro lugar, vamos identificar os limites inferiores (li) das seis classes definidas no exemplo: Classes Limites inferiores (li) 1ª 115 (menor dado identificado) 2ª 115 + 8 = 123 3ª 123 + 8 = 131 4ª 131 + 8 = 139 5ª 139 + 8 = 147 6ª 147 + 8 = 155 Feita a identificação dos limites inferiores de todas as 6 classes, vamos, a partir de agora, encontrar os valores referentes aos limites superiores das classes: Classes Limites superiores (Li) 1ª 123 - 1 = 122 2ª 131 - 1 = 130 3ª 139 - 1 = 138 Estatística Básica 23 4ª 147 - 1 = 146 5ª 155 - 1 = 154 6ª 163 - 1 = 162 Para a identificação dos limites superiores (Li) das classes, foi utilizado o limite inferior da classe seguinte menos 1. Dessa forma, os intervalos das classes em nossa distribuição ficaram da seguinte forma: Classes Limites das classes (li - Li) 1ª 115 - 122 2ª 123 - 130 3ª 131 - 138 4ª 139 - 146 5ª 147 - 154 6ª 155 - 162 Ou seja, para a construção dos intervalos de classes, utilizamos os dados definidos nos limites inferiores (li) e superiores (Li) de cada classe (i). Para finalizarmos o exemplo, vamos calcular o ponto médio de cada uma das classes definidas, lembrando que o cálculo da média é definido da seguinte forma: : Classes Limites das classes (li - Li) Média das classes (xi) 1ª 115 - 122 2ª 123 - 130 3ª 131 - 138 4ª 139 - 146 Estatística Básica 24 5ª 147 - 154 6ª 155 - 162 Por fim, identificamos que a média em relação à medição dos alunos consiste nos valores identificados em cada classe. Por exemplo, na terceira classe (i3), a média dos alunos é de 134,5 cm de altura. Assim sendo, tais resultados podem auxiliar o pesquisador na identificação das informações de forma mais abrangente, rápida e organizada. RESUMINDO: E então? Você gostou do que apresentamos? Conseguiu apreender tudo? Agora, só para termos a certeza de que você realmente entendeu o tema de estudo deste capítulo, vamos resumir tudo o que vimos. Você deve ter aprendido que, em uma distribuição de frequência, é importante conhecer os elementos que serão necessários para a construção da distribuição dos dados. Além disso, você pôde entender que, para tal construção, é necessária a identificação das classes (i) e os seus limites entre os valores que comporão tais classes, com isso, aprendeu a calcular os seus limites inferiores (li) e superiores (Li). Além disso, aprendeu que existem intervalos que precisam ser determinados entre os limites, para tanto, conheceu o que é a amplitude total de uma distribuição de frequência e, até mesmo, a amplitude amostral, que, muitas vezes, coincidem. Por fim, você também aprendeu como determinar a média que existe entre as classes, de maneira a identificar o ponto central de cada uma delas. Com isso, esperamos que você tenha compreendido como a estatística pode ser importante em nosso cotidiano e como ela pode nos auxiliar na geração de informações relevantes. Estatística Básica 25 Tipos de distribuição de frequências Objetivo: ao término deste capítulo, você terá conhecido os tipos de distribuição de frequência. Trata-se de um conteúdo importante para a compreensão dos tipos de informação que podem ser analisados e apresentados por você no desenvolvimento da sua profissão. E então? Motivado para desenvolver essa competência? Então, vamos lá! Entendendo os tipos de distribuição de frequência Depois de estudarmos como construir uma distribuição de frequência como nos exemplos dos capítulos anteriores, vamos compreender, a partir de agora, as diversas características adicionais que promovem um melhor entendimento dos dados levantados. Essas características são classificadas como: frequência simples ou absoluta, frequência relativa e frequência acumulada de cada classe, que podem ser incluídas como colunas adicionais de uma tabela de distribuição de frequência (FERRARI, 2004). Figura 3 – Tipos de distribuição de frequência Fonte: Elaborada pelos autores. Frequência simples ou absoluta Como estudamos em outros momentos, sabemos que toda pesquisa envolve uma coleta de dados que será organizada e analisada Estatística Básica 26 pelo pesquisador. Nesse sentido, quando determinamos o número de vezes que o valor de uma variável acontece, estamos demonstrando a sua frequência simples ou absoluta. Uma frequência simples ou absoluta considera o número de vezes que um valor assume em uma determinada variável. Assim, as frequências simples e absoluta são representadas pelo símbolo do (fi), como vimos em alguns capítulos anteriores.Essas frequências representam valores ou número de dados de cada classe de forma direta. Assim, a frequência simples ou absoluta consiste na soma de todas as ocorrências em cada classe, sendo igual ao número total de dados, como: Dessa forma, sabemos que o símbolo do sigma é a soma de todos os valores da frequência analisada. Como exemplo, podemos citar o resultado de uma pesquisa feita por alunos do Ensino Médio de uma escola: Idade Nº de alunos 14 20 15 35 16 40 17 40 18 45 Percebemos que a frequência simples ou absoluta é dada pela quantidade de vezes que a idade dos alunos se repete. Assim, podemos concluir que existem 35 alunos com 15 anos ou 40 alunos com 17 anos. Nessa situação, os dados quantitativos, expressos pela quantidade de alunos, representam a exatidão da situação analisada. Com isso, tais Estatística Básica 27 informações podem auxiliar nas decisões e nos resultados que podem ser utilizados pelo pesquisador. Frequência relativa Não é mais novidade para nós compreender que a coleta de dados é de suma importância em uma pesquisa, isso porque seu objetivo é analisar determinada situação. Com isso, as informações que são coletadas devem ser organizadas, se possível, em tabelas, para que se tenha um melhor entendimento das diferentes opções de respostas escolhidas pelos entrevistados. Nessa perspectiva, para darmos significado aos dados coletados, devemos utilizar a frequência relativa (fri), que, por sua vez, pode ser representada por meio de dados percentuais (%). Larson e Betsy (2015) defendem que a frequência relativa de uma classe consiste na fração ou proporção dos dados que compõem uma classe. Nesse sentido, determinamos a frequência relativa de uma classe dividindo a frequência (f) pelo tamanho (n) da amostra. Contudo, para transformarmos esses valores em percentagem (%), basta multiplicarmos o resultado encontrado por 100. Assim, a fórmula da frequência relativa será: Ademais, as frequências relativas (fri) ainda podem ser consideradas de forma alternativa, como resultado das razões entre as frequências simples (fi) e a frequência total (n); dessa forma, temos: Assim, podemos tirar várias conclusões a partir das análises de uma frequência relativa. Ela pode mostrar que uma classe contém uma parcela que aquela classe representa da amostra. Dessa forma, podemos Estatística Básica 28 exemplificar isso utilizando os dados do nosso primeiro capítulo, referentes aos preços de aparelhos de barbear portáteis. Se considerarmos frequência relativa da terceira classe, conseguimos o seguinte valor: Assim, podemos concluir que a terceira classe corresponde a uma fração de 0,2, ou seja, um total de 20% dos valores levantados. Por exemplo, na coleta de dados sobre os alunos do Ensino Médio da escola, podemos encontrar a frequência relativa da seguinte forma: Idade Nº de alunos (fi) Frequência relativa (fri) 14 20 15 35 16 40 17 40 18 45 Total 180 100% Com essas informações, podemos concluir que 19,44% dos alunos possuem 15 anos e 25% dos alunos possuem 18 anos de idade. Estatística Básica 29 Frequência acumulada Nessa mesma linha de raciocínio, podemos definir que a frequência acumulada de uma classe consiste na soma das frequências dessa classe com todas as outras classes anteriores. Dessa forma, a frequência acumulada da última classe será sempre igual ao tamanho (n) da amostra estudada (LARSON; BETSY, 2015). A frequência acumulada será representada pelo símbolo (Fj), que consiste na soma das frequências simples (fi) de todas as classes com intervalos inferiores a uma determinada classe. Assim, será representada matematicamente por: Ao utilizarmos os dados do exemplo do capítulo primeiro, calculamos a frequência acumulada correspondente à terceira classe: Nesse caso, implica dizer que existem 21 preços de aparelhos de barbear portáteis menores que 184, que é o limite superior da terceira classe (L3). Aplicação das frequências relativa e acumulada Como sequência do exemplo que iniciamos no primeiro capítulo, vamos preencher as demais colunas da tabela com as duas outras frequências que estudamos até agora (relativa e acumulada). No exemplo supracitado, foram identificados os preços de 30 aparelhos de barbear portáteis. Com essas informações, construímos a seguinte tabela com as distribuições das classes e a frequência simples (fi). Classes Distribuição das classes Frequência (fi) 1ª 65 - 104 6 2ª 105 - 144 9 Estatística Básica 30 3ª 145 - 184 6 4ª 185 - 224 4 5ª 225 - 264 2 6ª 265 - 304 1 7ª 305 - 344 2 Σf = 30 A partir de agora, vamos inserir nessa tabela mais duas colunas, as quais nomearemos de Frequência relativa (fri) e Frequência acumulada (Fj), como segue: Distribuição das classes Frequência (fi) Frequência relativa (fri) Frequência acumulada (Fj) 65 - 104 6 6 105 - 144 9 6 + 9 = 15 145 - 184 6 15 + 6 = 21 185 - 224 4 21 + 4 = 25 225 - 264 2 25 + 2 = 27 265 - 304 1 27 + 1 = 28 305 - 344 2 28 + 2 = 30 Σf = 30 100% Assim, a frequência relativa (fri) foi calculada a partir da frequência simples (fi) de cada classe dividida pelo número total da amostra (n), que, na questão, foi 30. Da mesma forma, para determinação da frequência Estatística Básica 31 acumulada (Fj), foi considerado o valor da (Fj) anterior mais a frequência simples (fi) da classe atual. Por fim, podemos, ainda, determinar o ponto médio de cada classe para saber qual o ponto central de cada informação coletada, logo: Distribuição das classes Ponto médio Frequência (fi) Frequência relativa (fri) Frequência acumulada (Fj) 65 - 104 6 20% 6 105 - 144 9 30% 15 145 - 184 6 20% 21 185 - 224 4 13,33% 25 225 - 264 2 6,67% 27 265 - 304 1 3,33% 28 305 - 344 2 6,67% 30 Σf = 30 100% Assim, os dados mostram que a média de cada classe (i) é a medida central de cada uma, ou seja, a média da segunda classe (i2) é o valor de 124,5. Estatística Básica 32 RESUMINDO: E então? Você gostou do que apresentamos? Conseguiu apreender tudo? Agora, só para termos a certeza de que você realmente entendeu o tema de estudo deste capítulo, vamos resumir tudo o que vimos. Você deve ter aprendido que existem três principais frequências que podem ser dispostas em nossas tabelas, são elas: a frequência simples ou absoluta, a frequência relativa e a frequência acumulada; que a frequência simples ou absoluta (fi) é mais utilizada e que caracteriza a quantidade de vezes que um dado se repete; que a frequência relativa (fri), por sua vez, representa a frequência em determinada classe dividida pela frequência total ou amostra total (n); e que a frequência acumulada (Fj) traz o acúmulo das frequências relacionadas às classes anteriores. Para fecharmos o raciocínio em relação aos tipos de frequência, calculamos, ainda, a média de cada classe para descobrirmos o ponto central de cada uma. Dessa forma, você aprendeu que os tipos de frequência são importantes para a compreensão das situações postas pelos dados coletados, que, se não estivessem agrupados e organizados em tabelas, não poderiam ser analisados. Estatística Básica 33 Gráficos de distribuição de frequência INTRODUÇÃO: No final deste capítulo, você será capaz de compreender quais são os gráficos que representam a distribuição de frequências. Este conteúdo é importante, uma vez que revelará que as informações do seu cotidiano podem ser apresentadas de forma dinâmica e clara. E então? Motivado para desenvolver essa competência? Então, vamos lá! Os gráficos Os fenômenos analisados nas ciências que envolvem a estatística são considerados recursos visuais que representam informações de forma clara. Seu uso pode ser observado em vários meios de comunicação do nosso cotidiano ao indicarem o percentual de participação da população em uma pesquisa, por exemplo, ou o crescimento das chuvas em uma região seca etc. Sua utilizaçãoreflete diversos padrões numéricos, específicos e gerais dos dados que são analisados, facilitando a interpretação e a organização de informações que auxiliam os usuários, seja para a construção do conhecimento, seja como receptor das informações elaboradas. Em uma comparação entre os gráficos e as tabelas estudados anteriormente, podemos perceber que os gráficos são menos claros em relação aos dados. Por sua vez, os gráficos têm como objetivo demonstrar o fenômeno de maneira global, fazendo com que o usuário perceba, de imediato, o comportamento das informações de forma geral. Nesse sentido, podemos afirmar, ainda, que as representações gráficas dos dados podem destacar as tendências, os incidentes, os valores mínimos e máximos, as ordens das grandezas e, assim, todos os fenômenos que são observados. Contudo, Ferrari (2004) destaca que todo gráfico deve ser simples, claro e verdadeiro, finalizado com as informações geradas. Para que isso Estatística Básica 34 aconteça, os gráficos devem ser elaborados com muito cuidado, zelo e muito trabalho. Existem alguns tipos de representação gráfica para expressar uma distribuição de frequência, mas os principais são: histograma e polígono de frequência. Figura 3 – Histograma Fonte: Feepik (2018). A seguir, vamos estudar como cada um desses gráficos pode ser construído a partir das informações contidas na distribuição de frequências. Histograma de frequência O histograma consiste em uma representação gráfica que destaca as tendências dos dados, as informações incidentes, os valores mínimos e máximos e, ainda, a magnitude dos fenômenos que são observados. Para Larson e Betsy (2015), o histograma que representa as frequências é um gráfico composto por barras que demonstram as frequências e sua distribuição por meio do conjunto de dados. Dessa forma, o histograma deve possuir as seguintes informações: I – Os valores dos dados (quantitativos) representados de forma horizontal. Estatística Básica 35 II – A frequências das classes representadas em escala vertical. III – As tiras que envolvem o gráfico de forma contínua se tocam. Quanto às barras contínuas do histograma, não deve existir um limite, ou seja, elas devem começar e terminar sem nenhum intervalo entre elas (classes). Considera-se, para eliminação desses intervalos, ou seja, para a transformação destes em números inteiros, a subtração de 0,5 de cada limite inferior da classe (li) e a adição de 0,5 a cada limite superior da classe (Li) (LARSON; BETSY, 2015). Assim, o limite superior de uma classe será sempre igual ao limite inferior da próxima classe. Construindo um histograma de frequência Levando em consideração o exemplo que utilizamos desde o primeiro capítulo, referente aos 30 valores dos aparelhos de barbear portáteis que foram coletados na pesquisa, vamos, em primeiro lugar, identificar os limites inferiores e superiores de cada classe, mas para os limites inferiores (li), subtraindo 0,5, e os limites superiores (Li), adicionando 0,5. Dessa forma, teremos os seguintes valores: Distribuição das classes Fronteiras das classes Frequência (fi) 65 - 104 64,5 – 104,5 6 105 - 144 104,5 – 144,5 9 145 - 184 144,5 – 184,5 6 185 - 224 184,5 – 224,5 4 225 - 264 224,5 – 264,5 2 265 - 304 264,5 – 304,5 1 305 - 344 304,5 – 344,5 2 Assim, encontramos os limites que serão considerados as fronteiras das classes, de maneira que não haja espaços entre elas. Perceba que, o limite superior (Li) da classe é sempre o limite inferior (li) da classe Estatística Básica 36 seguinte, fazendo com que os intervalos entre as barras, no histograma, não existam. O cálculo da fronteira inferior da primeira classe foi determinado a partir de: 65 – 0,5 = 64,5; já o da fronteira superior da primeira classe foi determinado a partir de: 104 + 0,5 = 104,5, e assim sucessivamente, em todas as classes do nosso exemplo. A partir dessas informações, podemos construir o histograma. A linha vertical representará a frequência de nossa distribuição, enquanto que a linha horizontal será representada pelas fronteiras das classes encontradas em nossa tabela, como mostra a Figura 5. Ademais, podemos utilizar, também para a linha horizontal do histograma, os pontos médios determinados em nosso exemplo destacado na Figura 6. Assim sendo, o histograma poderá ser representado das seguintes formas: Figura 5 – Histograma com fronteiras das classes 10 8 6 4 2 10 8 6 4 2 2 2 1 4 6 6 9 Fronteiras das classes. Preço Fonte: Elaborada pelos autores. Estatística Básica 37 Figura 6 – Histograma com pontos médios das classes 10 8 6 4 2 10 8 6 4 2 2 2 1 4 6 6 9 Pontos médios das classes. Preço Fonte: Elaborada pelos autores. Dessa forma, entendemos que, a partir dos histogramas construídos, mais de 60% dos valores dos aparelhos de barbear portáteis estão com o custo menor que 184,50, pois é o ponto em que os valores mais se acumulam, de acordo com a visualização dos gráficos. Logo, faz-se importante uma visão gráfica das informações, pois os dados são interpretados de maneira mais rápida e geral. Polígono de frequência Outra forma de demonstrar graficamente os dados de uma pesquisa em uma distribuição de frequência é usar um gráfico denominado polígono de frequência. Esse recurso visual em forma gráfica tem o objetivo de demonstrar, por meio de linhas, as mudanças que ocorreram de forma contínua nas frequências. Assim como no histograma, no polígono de frequência serão utilizadas linhas verticais e horizontais, mas em vez de barras, também serão utilizadas linhas. Estatística Básica 38 Construindo um polígono de frequência Para construirmos esse gráfico, vamos utilizar as mesmas informações do exemplo do primeiro capítulo: os valores dos aparelhos de barbear portáteis. Em primeiro lugar, vamos decidir os valores que representarão as linhas vertical e horizontal do polígono: na linha horizontal, serão utilizadas, mais uma vez, as informações relativas à frequência da nossa distribuição; já a linha horizontal será representada pelos pontos médios de cada classe. Diferentemente do que foi feito no histograma, no gráfico de polígono de frequência serão conectados os pontos entre a frequência e o ponto médio, de forma que as informações fiquem ordenadas. Além disso, vale destacarmos que o gráfico deve começar e terminar na linha horizontal. Dessa forma, vamos desenhar o comportamento das informações contidas na distribuição. Para tanto, vamos pegar a menor média, que foi 84,5, e deduzir a amplitude determinada no exemplo, logo, o ponto inicial será: 84,5 – 40 = 44,5. Esse preço não foi encontrado na pesquisa, então, na linha vertical, esse preço será zero, como podemos observar na Figura 7. Figura 7 – Polígono de frequência 10 8 6 4 2 • • • • • • • • • Preço Fonte: Elaborada pelos autores. Estatística Básica 39 Perceba que, à medida que vai direcionando para a direita, o ponto vai representando o cruzamento do valor médio do aparelho e sua frequência, finalizando com o valor de 324,5 + 40 = 364,5, que não possui nenhuma cotação em nosso exemplo, concluindo o que tínhamos discutindo antes, que o polígono iniciou e concluiu no eixo/linha horizontal. Assim, podemos concluir que o preço dos aparelhos portáteis de barbear alcançou o valor máximo de 124,50 e que, logo após, houve uma queda nos preços. Larson e Betsy (2015) aconselham que o histograma e o polígono de frequência sejam construídos juntos. Os autores orientam que, em primeiro lugar, deve-se construir o polígono de frequência, em que serão definidas as linhas verticais e horizontais apropriadas. No eixo horizontal, como estudamos, devem estar os pontos médios de cada classe, e no eixo vertical devem ser destacados osvalores de frequência contidos na tabela em análise. A partir de então, serão assinalados os pontos que representam o ponto médio e a frequência de cada classe. Após conectar os pontos por meio de linhas, conclua o trabalho construindo um gráfico de barras, denominando-o de histograma. Estatística Básica 40 RESUMINDO: E então? Você gostou do que apresentamos? Agora, só para termos a certeza de que você realmente entendeu o tema de estudo deste capítulo, vamos resumir tudo o que vimos. Você deve ter aprendido que existem duas principais formas de representações gráficas de uma distribuição de frequência, que é o histograma e o polígono de frequência. O histograma é uma representação gráfica das informações coletadas que contém dois eixos/ linhas, uma de forma vertical e outra de forma horizontal; uma representa as frequências de uma distribuição, já a outra pode representar os pontos médios ou as fronteiras das classes. O importante é que na construção de um histograma, não haja espaços/intervalos entre as barras, e é por isso que, para a identificação do limite inferior da fronteira, deduz-se 0,5, já para a identificação do limite superior da fronteira, adiciona-se 0,5. Estudamos também que o polígono de frequência é construído de acordo com as informações também contidas no histograma. Os dois conterão eixos verticais e horizontais que representam os dados distribuídos na tabela. O polígono, por sua vez, não será desenhado por barras, mas por linhas que ligarão as frequências e os pontos médios de uma distribuição, mas lembre-se de que, no polígono, o início e o final devem ser feitos no eixo horizontal. Com isso, aprendemos que as formas gráficas de representar uma distribuição de frequência podem ser mais simples de serem interpretadas se consideradas as informações de maneira geral. Estatística Básica 41 REFERÊNCIAS CRESPO, A. A. Estatística fácil. 19. ed. São Paulo: Saraiva, 2009. FERRARI, F. Estatística básica. Rio Grande: Fundação Universidade Federal do Rio Grande, 2004. LARSON, R.; BETSY, F. Estatística aplicada. Tradução de José Fernando Pereira Gonçalves. São Paulo: Pearson Education do Brasil, 2015. Estatística Básica Adauto José Valentim Neto e Dayanna Costa Estatística Básica _Hlk58920802 Distribuição de frequências Distribuição de frequências Passo a passo para elaboração da distribuição de frequência Elementos da distribuição de frequências Classes Limites de classe Intervalo de classe Amplitude total da distribuição Amplitude amostral Ponto médio de uma classe Identificação dos elementos de uma distribuição de frequência Tipos de distribuição de frequências Entendendo os tipos de distribuição de frequência Frequência simples ou absoluta Frequência relativa Frequência acumulada Aplicação das frequências relativa e acumulada Gráficos de distribuição de frequência Os gráficos Histograma de frequência Construindo um histograma de frequência Polígono de frequência Construindo um polígono de frequência