Prévia do material em texto
Estatística e Probabilidade Prof. Me. Diego Souza Introdução Quando lidamos com grandes conjuntos de dados, e às vezes até lidando com conjuntos nem tão grandes, pode ser bem problemático obter uma boa visualização da informação transmitida. Tradicionalmente, isso envolve uma distribuição de frequência ou alguma de suas representações gráficas, em que agrupamos ou classificamos os dados num certo número de categorias ou classes. 2 Introdução Vejamos dois exemplos. Num levantamento recente foram obtidos os movimentos totais (arredondados até a unidade monetária mais próxima) de 4.757 escritórios de advocacia. Em vez de dar a lista dos 4.757 valores, a informação é difundida pela tabela seguinte: 3 Introdução 4 Introdução Isso também deve ser o caso da tabela seguinte, fornecida pelo Departamento de Aviação Civil, que resume o número de queixas de passageiros contra companhias aéreas em 2004: 5 Introdução 6 Principais Conceitos • Quando os dados estão agrupados segundo o tamanho numérico, como no primeiro exemplo, dizemos que a tabela resultante é uma distribuição numérica ou uma distribuição quantitativa. • Quando os dados estão agrupados em categorias que não são numéricas, como no segundo exemplo, dizemos que a tabela resultante é uma distribuição categórica ou uma distribuição qualitativa. • Em ambos casos nos referimos a distribuições de frequência. 7 Principais Conceitos • As distribuições de frequência apresentam os dados de uma forma relativamente compacta, dão uma boa visualização global e contêm informações adequadas para muitos propósitos mas, como já observado, existe alguma perda de informação. • Algumas coisas que podem ser determinadas a partir dos dados originais não podem ser determinadas a partir de uma distribuição. 8 Principais Conceitos • Dados nominais, ordinais e discretos, depois de apurados, devem ser organizados em tabelas de distribuição de frequências. • Frequência de uma categoria é o número de vezes que essa categoria ocorre na amostra (ou seja, no conjunto de dados apurados). • Distribuição de frequências é a maneira de apresentar as categorias (ou intervalos) dos dados apurados com as respectivas frequências. 9 Dados Nominais • Para organizar dados nominais em uma tabela de distribuição de frequências escreva, em coluna, o nome da variável em estudo e logo abaixo, na mesma coluna, as categorias da variável. Em outra coluna, escreva as frequências. Cada frequência deve ficar na linha da respectiva categoria. 10 Dados Nominais • Considere um grupo de 17 visitantes de um clube de tiro ao alvo. O treinador anotou o número de homens e o de mulheres para organizar os dados em uma tabela de distribuição de frequências. Para isso, deve escrever o nome da variável (sexo) e, em coluna, as categorias (masculino e feminino). As frequências são 10 visitantes do sexo masculino e sete do sexo feminino que, somadas, dão um total de 17 visitantes. 11 Dados Nominais 12 Dados Ordinais • Dados ordinais devem ser organizados em tabelas de distribuição de frequências. Escreva, na primeira coluna, o nome da variável em estudo e, logo abaixo, os nomes das categorias em ordem crescente. As frequências devem estar em outra coluna, mas nas linhas das respectivas categorias. 13 Dados Ordinais • Como exemplo, considere que o treinador do clube de tiro resolveu organizar a distribuição de frequências para a variável escolaridade. O nome da variável e suas categorias foram escritos na primeira coluna e, na segunda coluna, as respectivas frequências. 14 Dados Ordinais 15 Dados Discretos • Dados discretos também são organizados em tabelas de distribuição de frequências. Para isso, os valores que a variável pode assumir são colocados na primeira coluna, em ordem crescente. O número de vezes que cada valor se repete é escrito em outra coluna, mas nas respectivas linhas. • Reveja o exemplo do clube de tiro. O número de acertos obtidos pelas 17 pessoas está na distribuição de frequências dada em seguida. 16 Dados Discretos 17 Dados Contínuos • Dados contínuos assumem valores diferentes, mesmo em amostras pequenas. Por essa razão, a menos que sejam em grande número, são apresentados na forma como foram coletados. • Considere, como exemplo, que o treinador do clube de tiro resolveu organizar as idades em uma tabela. Pode escrever os dados na ordem em que foram coletados, como segue: 18 Dados Contínuos 19 Elementos de uma distribuição de frequência Classes Classes de frequência ou, simplesmente, classes são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i= 1, 2, 3, ... , k (onde k é o número total de classes da distribuição). 20 Elementos de uma distribuição de frequência IMPORTANTE Raramente utilizamos menos do que cinco ou mais do que quinze classes; o número exato em cada situação depende em grande parte de quantas medidas ou observações existem. Devemos sempre ter a certeza de que cada item (medida ou observação) se enquadre em uma, e apenas uma, classe. Sempre que possível, as classes devem cobrir amplitudes iguais de valores. 21 A distribuição de frequências Contudo verifica-se que as distribuições de frequência apresentam a informação de uma forma mais conveniente, e o preço que pagamos por isso, a perda de certa informação, em geral compensa. A construção de uma distribuição de frequência consiste essencialmente em: 1. Escolher as classes (intervalos ou categorias) 2. Separar ou enquadrar os dados nessas classes 3. Contar o número de itens de cada classe 22 A distribuição de frequências Uma regra prática é a seguinte: o número de classes deve ser aproximadamente igual à raiz quadrada do tamanho da amostra, representada por n. 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑙𝑎𝑠𝑠𝑒𝑠 = 𝑛 23 A distribuição de frequências Para a determinação do número de classes de uma distribuição podemos lançar mão da regra de Sturges, que nos dá o número de classes em função do número de valores da variável: 𝑘 ≈ 1 + 3,3 log 𝑛 24 A distribuição de frequências Decidido o número de classes que deve ter a distribuição, resta- nos resolver o problema da determinação da amplitude do intervalo de classe, o que conseguimos dividindo a amplitude total pelo número de classes. 25 A distribuição de frequências A amplitude (h) dos intervalos pode ser obtida subtraindo do maior valor da variável em estudo o menor (cálculo da amplitude total da amostra) e dividindo esse resultado pelo número k considerado. 𝒉 = 𝑿𝒎á𝒙𝒊𝒎𝒐 − 𝑿𝒎í𝒏𝒊𝒎𝒐 𝒌 26 A distribuição de frequências Limites de Classe Denominamos limites de classe os extremos de cada classe. O menor número é o limite inferior da classe (𝑙) e o maior número, o limite superior da classe (𝐿). 27 A distribuição de frequências Ponto médio de classe Ponto médio de uma classe é, como o próprio nome indica, o ponto que divide o intervalo de classe em duas partes iguais. 𝑥𝑖 = 𝐿 + 𝑙 2 28 Tipos de frequências • Frequência simples ou frequência absoluta ou, simplesmente, frequência de uma classe ou de um valor individual é o número de observações correspondentes a essa classe ou a esse valor. É representando da seguinte forma: 𝑓𝑖 • De forma que ao final poderemos obter o somatório de todas as frequências simples com a seguinte notação: σ𝑖=1 𝑘 𝑓𝑖 29 Tipos de frequências É fácil entender as informações apresentadas em distribuições de frequências. Entretanto, as frequências dependem do tamanho da amostra: um em dez é mais importante que um em um milhão. Para ter visão do tamanho de uma categoria em relação ao tamanho da amostra, calculamos a frequência relativa. Frequência relativa de uma categoria é o resultado da divisão da frequência dessa categoria pelo número de dados (tamanho) da amostra. 𝐹 = 𝑓𝑖 σ𝑖=1 𝑘 𝑓𝑖 30 Tipos de frequências Frequência acumulada É o total das frequências de todos os valores inferiores ao limite superior do intervalo de uma dadaclasse: 𝑓𝑎𝑐 = 𝑓1 + 𝑓2 +⋯+ 𝑓𝑘 31 Tipos de frequências Frequência relativa acumulada Frequência acumulada relativa (Fac) de uma classe é a frequência acumulada da classe, dividida pela frequência total da distribuição, ou pelo somatório de todas as frequências relativas inferiores ao limite superior do intervalo de uma dada classe. 𝑭𝒂𝒄 = 𝒇𝒂𝒄 σ𝒊=𝟏 𝒌 𝒇𝒊 𝑭𝒂𝒄 = 𝑭𝟏 + 𝑭𝟐 +⋯+ 𝑭𝒌 32 POSITIVA Exercício de Aplicação PRÓXIMA AULA? • Medidas de Tendência e Posição