Baixe o app para aproveitar ainda mais
Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
* Aula 2 Estatística Descritiva Parte I Organização dos dados Dsitribuição de frequências * 1. Introdução * Considere a seguinte situação. Você desenvolveu um experimento em 20 pés de milho cultivados em casa de vegetação, para testar o efeito de um inseticida orgânico sobre pulgões. 2. Organização dos dados * 45, 41, 42, 41, 42, 43, 44, 41 , 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 Após quatro dias de aplicação do inseticida você anotou o número de pulgões mortos em cada planta. * Qual a variável em análise? Relembrando a aula passada ... Qual a unidade de observação? Qual a natureza da variável em análise? Retornando à aula de hoje ... * A coleta de dados é o início da análise estatística, pois fornece o material bruto que se quer estudar. É função do pesquisador transformar os dados brutos em um conjunto organizado de informações. Ao anotar o número de pulgões mortos em cada pé de milho você realizou uma coleta de dados. * Como organizar e apresentar os dados obtidos no seu experimento? A organização e apresentação dos dados pode ocorrer, basicamente, de duas maneiras: apresentação tabular: é uma apresentação numérica dos dados em linhas e colunas distribuídas de modo ordenado, segundo regras práticas fixadas pelo Conselho Nacional de Estatística. apresentação gráfica: constitui uma apresentação geométrica permitindo uma visão rápida e clara do fenômeno. * 3. Tabela de distribuição de frequências Um procedimento inicial para organizar e agrupar os dados dispersos referentes a uma variável é através de uma : TABELA DE DISTRIBUIÇÃO DE FREQUÊNCIAS * Tabela de distribuição de frequências é uma tabela que resume a informação contida na amostra e referente a uma dada variável, ordenando os valores e agrupando-os em classes. A tabela de distribuição de frequências pode ser utilizada para organizar dados referentes a variáveis quantitativas ou qualitativas. * 3.1 Tabela de distribuição de frequências – variável qualitativa Para construir uma distribuição de frequências dos dados de uma variável qualitativa basta contar a quantidade de resultados observados em cada categoria. Como exemplo admita uma pesquisa que tem por objetivo descrever como os produtores de mamona realizam a adubação ou trato nutricional do solo antes do plantio dessa oleaginosa. * Para tanto, o pesquisador perguntou a 118 produtores: Que tipo de adubação realiza antes do plantio da mamona? As opções de resposta foram: ( ) sem adubação ( ) adubação química ( ) adubação orgânica * * 3.2 Tabela de distribuição de frequências – variável quantitativa Tabela de frequências para dados não agrupados em classes com intervalos. Tabela de frequências para dados agrupados em classes com intervalos A Tabela de distribuição de frequências associada a uma variável quantitativa pode ser classificada de duas formas * 3.2.1 Tabela de distribuição de frequências para dados agrupados SEM intervalos de classes. É a simples condensação dos dados conforme as repetições de seu valores. * Retornado ao seu experimento com insetida orgânico para combater pulgões em pés de milho, a organização dos 20 dados - referentes à variável número de pulgões mortos - em uma tabela de distribuição de frequências com dados não agrupados em intervalos de classes segue o seguinte procedimento: * No exemplo dado anteriormente 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51 1) ROL: É a ordenação dos dados (crescente ou decrescente). ROL Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 * Valores observados Freqüência 41 3 42 2 43 1 44 1 45 1 46 2 50 2 51 1 52 1 54 1 57 1 58 2 60 2 2) Contagem do número de ocorrências ou frequência de cada valor observado * Existem situações em que organizar os dados em uma tabela de distribuição de frequências para dados não agrupados em intervalos torna-se inviável, simplesmente porque o banco de dados é composto por um grande número de dados distintos. Isto é muito comum em variáveis quantitativas contínuas: Altura Peso Temperatura Assim, para facilitar a análise dos dados, convém organizá-los em um tabela de distribuição de frequências para dados agrupados em classes com intervalos. * 3.2.2 Tabela de distribuição de frequências para dados agrupados EM intervalos de classes. a) Elementos de uma distribuição de frequências com intervalos de classe: i) CLASSES São os intervalos de variação da variável. Cada classe é simbolizada por i e o número total de classes simbolizado por k. * Ex: na tabela abaixo k = 5 e 49 |------- 53 é a 3ª classe, onde i = 3 Intervalos de Classe Frequências 41 (— 45 7 45 (— 49 3 49 (— 53 4 53 (— 57 1 57 (— 61 5 Total 20 * b) Como definir o número de classes? i) REGRA DE STURGES para determinação do número de classes: Essa regra estabelece que o número de classes é igual a: k = 1 + 3,3 log n sendo k = número de classes e n = nº total de observações Exemplo: a) Se o número de observações for 500: n = 500 k = 1 + 3,3 log(500) = 1 + 3,3(2,699) = 9,907 k = 9,907 ou arredondando k = 10 * ii) Regra do Quadrado: K = √n K = √500 > 20 Os valores encontrados por meio dos métodos sugeridos não são próximos. Qual a melhor regra? Na prática, o pesquisador deve utilizar o bom senso. As regras apenas auxiliam na decisão. Regra da Potência de 2 • k = menor valor interiro tal que 2 k ≥ n – Regra da raiz quadrada • – Bom senso !!! • Decida a quantidade de classes que GARANTA observar como os valores se distribuem. n * “ Uma regra de bolso diz que as tabelas de distribuição de freqüências devem ter de 5 a 20 classes, pois abaixo de 5 está se perdendo informação preciosa diluída nas classes e acima de 30 o nível de detalhamento torna-se exagerado e pouco eficaz. Alguns autores sugerem que a distribuição intervalar tenha de 5 até 16 classes .” * c) Limites das classes São os extremos de cada classe. O menor número é o limite inferior de classe (l) e o maior número, limite superior de classe(L). Ex: em 49 |------- 53... l3= 49 e L3= 53. O símbolo |------- representa um intervalo fechado à esquerda e aberto à direita. * O dado 53 do ROL não pertence à classe 3 e sim à classe 4 representada por 53 |------- 57. Classes Frequências 41 (— 45 7 45 (— 49 3 49 (— 53 4 53 (— 57 1 57 (— 61 5 Total 20 * d) Amplitude do intervalo de classe (hi) É a diferença entre o limite superior e o limite inferior de uma classe é simbolizada por hi = Li - li. Ex: na tabela anterior hi= 53 - 49 = 4. Obs: Na distribuição de freqüência c/ classes hi será igual em todas as classes. * e) Amplitude total da distribuição É a diferença entre o limite superior da última classe e o limite inferior da primeira classe. AT = L(max) - l(min). Ex: na tabela AT = 61 - 41= 20. Classes Frequências 41 (— 45 7 45 (— 49 3 49 (— 53 4 53 (— 57 1 57 (— 61 5 Total 20 * f) Amplitude total da amostra É a diferença entre o valor máximo e o valor mínimo da amostra (ROL). Onde AA = Xmax - Xmin. Ex: AA = 60 - 41 = 19. Obs: AT sempre será maior que AA. * g) Ponto médio de classe É o ponto que divide o intervalo de classe em duas partes iguais. Ex: em 49 |------- 53 o ponto médio x3 = (53+49)/2 = 51, ou seja, x3 = (l3+L3)/2. * 4 Método prático para construção de uma dist. De frequências c/ classe 1º - Organize os dados brutos em um ROL. 2º - Calcule a amplitude amostral AA. No nosso exemplo: AA =60 - 41 =19 3º - Calcule o número de classes (k) {k = n1/2} * 4º - Decidido o nº de classes calcule a amplitude do intervalo de classe h > AA/k. No exemplo: AA/k= 19/5 = 3,8 . Obs1: Como h > AA/i é um valor ligeiramente superior para haver folga na última classe. Utiliza-se h = 4 * Obs2: Relembrando, qualquer regra para determinação do nº de classes da tabela não nos leva a uma decisão final; esta vai depender, na realidade de um julgamento pessoal, que deve estar ligado à natureza dos dados. No exemplo: n = 20 dados, então , em princípio, a regra sugere a adoção de 5 classes. * 5º - Temos então o menor nº da amostra, o nº de classes e a amplitude do intervalo. Podemos montar a tabela, com o cuidado para não aparecer classes com freqüência = 0 (zero). No nosso exemplo: o menor dado da amostra = 41, h = 4 Logo a primeira classe será representada por 41 |------- 45. As classes seguintes respeitarão o mesmo procedimento. * Definidas as classes da tabela as colunas seguintes serão representadas pelas seguintes frequências: Frequência absoluta Frequência relativa Frequencia acumulada absoluta Frequência acumulada relativa * 5 Tipos de frequências Frequência simples ou absoluta (fi): é o número de observações de um valor individual (ou de uma classe). A soma das freqüências simples é igual ao número total dos dados da distribuição. * Frequência relativa (fr): representa a proporção de observações de um valor (ou de uma classe) em relação ao número total de observações. Fr = fi/∑fi *100 A soma das freqüências relativas é igual a 1 (100 %). * Frequência acumulada absoluta (faci): é a soma de todas as frequências absolutas abaixo do limite superior de uma classe considerada. F4 = f1 + f2 + f3 + f4 = 7 + 3 + 4 + 1 = 15 * Freqüência acumulada relativa de um classe (Fri):é a freqüência acumulada da classe, dividida pela freqüência total da distribuição. Fri = Fi/∑Fi *100 * Concluindo, uma distribuição de frequencias permite diferentes análises. No exemplo do número de pulgões mortos em cada pé de milho: O total de plantas com o maior número de pulgões mortos; Quantas plantas estão em determinado intervalo; O percentual de plantas contidas em determinado intervalo; O percentual acumulado de plantas até um determinado número de pulgões mortos. * 6 Representação gráfica de uma distribuição de frequências Histograma Polígono de freqüência Ogiva . * Em todos os gráficos citados utilizamos o primeiro quadrante do sistema de eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas) colocamos os valores da variável e na linha vertical (eixo das ordenadas), as freqüências. * Histograma É formado por um conjunto de retângulos justapostos, cujas bases se localizam sobre o eixo horizontal, de tal modo que seus pontos médios coincidam com os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das freqüências simples ou absolutas. * * Polígono de freqüência É um gráfico em linha, sendo as freqüências marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura, ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. * * Ogiva É o gráfico usado na representação gráfica da distribuição de freqüências acumuladas de uma variável contínua. Para a construção da ogiva, são usadas as freqüências acumuladas (absolutas ou relativas) no eixo vertical e os limites superiores de classe no eixo horizontal. * * Resolva exercícios referentes a esta unidade. *
Compartilhar