Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Probabilidade e Estatística Professor André Espíndola 2014 Professor André Espíndola ANÁLISE DE CONJUNTOS DE DADOS AGRUPADOS Professor André Espíndola INTRODUÇÃO � Quando se lida com grandes conjuntos de dados, pode-se obter uma boa visualização e todas as informações necessárias, agrupando os dados em certo número de classes, intervalos ou categorias. Professor André Espíndola DADOS BRUTOS � Conjunto de dados obtidos após a crítica dos valores, não é empregada nenhuma ordenação ou classificação nesse conjunto. Professor André Espíndola Professor André Espíndola ROL � Conjunto de dados brutos organizado, ou seja, existe uma determinada ordem ou classificação dos dados. 2 Professor André Espíndola DISTRIBUIÇÃO DE FREQUÊNCIAS � Distribuição de frequências é uma técnica estatística para apresentar uma coleção de objetos classificados de modo a mostrar o número existente em cada classe ou grupo. Quando montamos uma D.F. podemos ter as seguintes frequências: Professor André Espíndola Frequências � FREQUÊNCIA ABSOLUTA SIMPLES (fi): é o número de vezes que determinado valor aparece em uma população ou amostra. � FREQUÊNCIA RELATIVA SIMPLES (fr): é a razão entre a frequência simples e o tamanho da amostra ou população. � FREQUÊNCIA ABSOLUTA ACUMULADA (Fi): é a soma das frequências absolutas de uma classe com as frequências absolutas simples das classes anteriores. � FREQUÊNCIA RELATIVA ACUMULADA (Fr): é a soma das frequências relativas de uma classe com as frequências relativas das classes anteriores. Professor André Espíndola Exemplos: Dados agrupados em classes: Professor André Espíndola Exemplo: Dados agrupados Professor André Espíndola Etapas Básicas � As três etapas necessárias para definir as classes para uma distribuição de frequências com dados quantitativos são: � 1) Determinar o número de classes não sobrepostas. � 2) Determinar a extensão (tamanho) de cada classe. � 3) Determinar os limites de cada classe. Professor André Espíndola Conceitos básicos � Número total de observações: representa-se por n quando se trata de amostra e N quando se trata de população. � Limite inferior de observação: é o menor valor encontrado no rol. � Limite superior de observação: é o maior valor do conjunto. � Intervalo de observação ou amplitude de observação (H): é a diferença entre os limites de observação. � Número de classes ( k ): As classes são formadas especificando-se os intervalos que serão usados para agrupar as observações no conjunto de dados. 3 Professor André Espíndola Exemplo: Dados Brutos Professor André Espíndola Exemplo: ROL H = 173-150 = 23 Professor André Espíndola � Largura (ou amplitude) das classes: Recomenda-se que a largura seja a mesma para cada uma das classes. Construindo as classes com a mesma largura, reduzem-se as chances de interpretações inapropriadas pelo usuário. é a diferença entre o limite inferior da classe seguinte e o limite inferior da classe em questão. � Limites de classe: Os limites de classe precisam ser escolhidos de modo que cada uma das observações pertença a somente uma classe. � O limite inferior (li) de classe é o menor valor possível dos dados da respectiva classe. � O limite superior (Li) de classe é o maior valor possível dos dados da respectiva classe. � Ponto médio da classe : é a média aritmética entre os extremos da classe. Professor André Espíndola DF k = 6 classes h = 4 li = 150 lf = 154 PM = 152 Professor André Espíndola Exercícios Professor André Espíndola 4 Professor André Espíndola Responda a) Qual a amplitude de observação? b) Qual a amplitude do segundo intervalo de classe? c) Qual o número de classes da distribuição? d) Qual o limite superior da classe de ordem 2? e) Qual o limite inferior da quarta classe? Professor André Espíndola Representação gráfica de uma distribuição de frequências � Uma distribuição de frequências pode ser representada graficamente pelo histograma, pelo polígono de frequências simples e pelo polígono de frequências acumulada: Professor André Espíndola O HISTOGRAMA é a representação gráfica mais comum de uma distribuição de frequências e é formado por um conjunto de retângulos (justapostos quando a variável for contínua), que tem: a) a base sobre o eixo horizontal com o centro no ponto médio e largura igual a amplitude do intervalo de classes; b) a área proporcional à soma das frequências. Professor André Espíndola Histograma de Frequência Absoluta Professor André Espíndola Histograma de Frequência Relativa Professor André Espíndola � O POLÍGONO DE FREQUÊNCIAS SIMPLES é um gráfico obtido ligando-se os pontos médios dos topos dos retângulos de um histograma. Para realmente obter um polígono (linha fechada), deve-se ligar os extremos da linha aos pontos médios da classe anterior à primeira e da posterior à última, da distribuição. 5 Professor André Espíndola POLÍGONO DE FREQUÊNCIAS SIMPLES Professor André Espíndola � O POLÍGONO DE FREQUÊNCIAS ACUMULADAS é traçado marcando-se as frequências acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos limites superiores dos intervalos de classe. Professor André Espíndola Polígono de Frequência Acumulada baseado Professor André Espíndola MEDIDAS DE TENDÊNCIA CENTRAL (a partir da D.F.) No passado, deu-se considerável atenção à descrição de dados agrupados, porque, de modo geral, era vantajoso agrupar os dados antes de calcular várias medidas estatísticas. Hoje as condições são outras, pois os cálculos necessários podem ser feitos em questão de segundos por um computador. Mas alguns dados (cifras do governo e distribuição de medidas contínuas, por exemplo) só são acessíveis em forma de distribuições de frequências. Professor André Espíndola MÉDIA Professor André Espíndola Consideremos a distribuição: 6 Professor André Espíndola MEDIANA � Primeiro: Determinar a Classe Mediana através do Ponto Mediano: � A classe será aquela correspondente à frequência acumulada imediatamente superior ao Ponto Mediano. Professor André Espíndola Mediana Professor André Espíndola Exemplo: Calcule a média e a mediana da distribuição de frequência abaixo: Professor André Espíndola Observação: � Devido às condições impostas na obtenção da fórmula da mediana, fica evidente que o valor obtido pela fórmula é um valor aproximado do verdadeiro valor da mediana da série. � De modo geral, todas as medidas calculadas para uma variável contínua serão valores aproximados para estas medidas, uma vez que ao agruparmos os dados segundo uma variável contínua, há perda de informações quanto à identidade dos dados. Professor André Espíndola MODA � A classe que apresenta a maior frequência é denominada classe modal. � Obs: Podemos determinar a moda como sendo o ponto médio da classe modal. Professor André Espíndola Exemplo: As alturas dos alunos de uma escola estão representadas na tabela abaixo. Calcule a altura modal. 7 Professor André Espíndola Exemplo: As velocidades das motocicletas estão representadas na tabela abaixo. Calcule a velocidade modal. Professor André Espíndola MEDIDAS DE DISPERSÃO (OU DE VARIABILIDADE) Variância: � A variância amostral para dados agrupados é calculada pela seguinte fórmula: Professor André Espíndola � Como o desvio padrão é a raiz quadrada positiva da variância, temos, para dados agrupados: Desvio padrão para dados agrupados Professor André Espíndola COEFICIENTE DE VARIAÇÃO � O coeficiente de variação é uma medida adimensional, útil paracomparar resultados de amostras cujas unidades podem ser diferentes. � É definido como o quociente entre o desvio padrão e a média e, em geral, é expresso em percentual. Professor André Espíndola CURVAS DE FREQUÊNCIAS � Como, em geral, os dados coletados pertencem a uma amostra extraída de uma população, podemos imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classes ficando cada vez menor, o que nos permite concluir que a linha poligonal (contorno do polígono de frequência) tende a se transformar numa curva - a curva de frequências - mostrando a verdadeira natureza da distribuição da população. � Podemos dizer, então, que, enquanto o polígono de frequência nos dá a imagem real do fenômeno estudado, a curva de frequência nos dá a imagem tendencial. Professor André Espíndola Curvas em forma de sino � Caracterizam-se pelo fato de apresentarem um valor máximo em torno da região central. � São muitos os fenômenos que oferecem distribuições em forma de sino: a estatura de adultos, o peso de adultos, a inteligência medida em testes. � As curvas em forma de sino podem ser simétricas ou assimétricas. � a) SIMÉTRICA: Esta curva caracteriza-se por apresentar o valor máximo no ponto central e os pontos equidistantes desse ponto terem a mesma frequência. � b) ASSIMÉTRICA: Na prática, não encontramos distribuições perfeitamente simétricas. Assim, as curvas correspondentes a tais distribuições apresentam a cauda de um lado mais alongada que do outro . Se a cauda mais alongada fica à direita, a curva é chamada assimétrica positiva. Se a cauda se alonga à esquerda, a curva é assimétrica negativa. 8 Professor André Espíndola Exemplo Professor André Espíndola Referências � SCHIFFMAN, L. & KANUK, L. Comportamento do consumidor. LTC Editora. 6a ed. 2000. P. 27) � DEVORE, J. L. Probabilidade e Estatística para Engenharia e Ciências. 6.ed. São Paulo: Pioneira Thomson Learning, 2006. � MORETTIN, P.A., BUSSAB, W. O. Estatística Básica. 5.ed. São Paulo: Ed. Saraiva, 2002. � SPIEGEL, M. R. Estatística. 2.ed. Rio de Janeiro: Ao Livro Técnico S.A., 1969. SPIEGEL, M. R.. Manual de fórmulas, métodos e tabelas de matemática. São Paulo: Ed. Makron Books do Brasil, 1992. � BUSSAB, Wilton O., MORETTIN, Pedro A. Estatística Básica. 5 ed. São Paulo: Saraiva, 2002. � DOWNING, Douglas. Estatística Aplicada.2.ed São Paulo: Saraiva, 2002. � TRIOLA, Mario Introdução à Estatística. 7.ed. Rio de Janeiro: LTC, 1999.
Compartilhar