Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade II ESTATÍSTICA Prof. Fernando Rodrigues Tabelas de frequência e gráficos Uma vez definidos o tema de interesse de um estudo estatístico e as variáveis de interesse, passa-se à etapa de obtenção dos dados. A forma de obter dados dependerá do p tipo de pesquisa a ser realizada. Uma vez obtidos os dados, monta-se uma tabela em que, para cada elemento pesquisado, colocam-se os valores correspondentes de cada variável. Tabelas de frequência e gráficos É comum chamar a essa etapa de tabulação dos dados. O resultado final será então a tabela de dados brutos, ou seja, dados que ainda não foram lapidados, analisados. As tabelas de dados brutos, embora tragam todas as características do conjunto, não permitem que tenhamos um entendimento dele, pois os dados assim dispersos somente nos permitem f i f t dformar uma imagem fragmentada. Tabelas de frequência e gráficos Uma primeira maneira para verificar-se as informações escondidas em uma tabela de dados brutos é a construção das tabelas de frequência (ou distribuições de frequência) para d d iá icada uma das variáveis. Estas tabelas agrupam os dados com valores iguais ou similares em uma mesma classe e nos dão as frequências com que cada valor ou intervalo de l j t t d dvalores aparece no conjunto estudado. Tabelas de frequência e gráficos Chamamos de distribuição de frequência, a forma tabular de um conjunto de valores, onde colocamos na primeira coluna os valores distintos da série de dados, em ordem crescente, e d l f ê i i lna segunda coluna a frequência simples destes dados. Chama-se frequência simples o número de vezes que um determinado dado aparece na série. Teremos uma forma específica de distribuição de frequência para representar variáveis discretas e variáveis contínuas. Tabelas de frequência e gráficos Distribuição de frequência - variável discreta Supondo que a observação das notas de 20 alunos de uma classe resultou nos seguintes valores: X: 5; 5; 4; 6; 10; 10; 8; 5; 4; 8; 9; 4; 7; 7; 5;X: 5; 5; 4; 6; 10; 10; 8; 5; 4; 8; 9; 4; 7; 7; 5; 10; 10; 9; 5; 10. Chamamos de xi a coluna que mostra os valores distintos que aparecem na série, e fi a coluna que mostra a frequência destes valores na série.valores na série. A distribuição de frequências para esta série X seria: Tabelas de frequência e gráficos xi fi 4 3 5 5 6 1 7 2 8 2 9 2 10 5 Note que conseguimos reduzir os 20 valores da série para uma tabela com 7 elementos distintos. Tabelas de frequência e gráficos xi fi 4 3 5 5 6 1 7 2 8 2 9 2 10 5 Se somarmos todos os valores da coluna das frequências, teremos o número total de elementos da série (n). Tabelas de frequência e gráficos Podemos acrescentar uma terceira coluna a esta tabela que indica a participação percentual de cada elemento na série. Chamamos esta informação de frequência relativa de um elemento (fr). Para chegar a este valor, basta dividir a frequência simples de cada elemento pelo número total de elementos da série (n ). fi Portanto: Multiplicando o valor obtido por 100, teremos o correspondente valor percentual. n ff iri = Tabelas de frequência e gráficos xi fi fri 4 3 15% 5 5 25% 6 1 5% 7 2 10% 8 2 10% 9 2 10% 10 5 25% Se somarmos os valores da coluna fri, obteremos 100%, que representa o volume total de dados da série. Tabelas de frequência e gráficos Distribuição de frequência - variável contínua De forma semelhante, podemos construir a distribuição de frequência para uma série de dados que se apresentem como uma variável contínua. Como vimos, denominamos variável contínua aquela que pode assumir infinitos valores, ou na prática, um número muito elevado de valores diferentes. Neste caso agruparemos estes valores em classes, de modo a reduzirmos ainda mais a quantidade de elementos. Tabelas de frequência e gráficos Distribuição de frequência - variável contínua Por exemplo, vamos supor que uma pesquisa salarial em uma determinada empresa verificou os seguintes valores para os 20 funcionários: X: 1.000,00; 1.100,00; 1.200,00; 1.250,00; 1.180,00; 1.230,00; 1.150,00; 1.250,00; 1.200,00; 1.500,00; 1.550,00; 1.150,00; 1.150,00; 1.600,00; 1.600,00; 1.550,00; 1.700,00; 2.000,00; 1.950,00; 2.000,00 Podemos reduzir estes dados, construindo a seguinte distribuição de frequências, variável contínua: Tabelas de frequência e gráficos Classe Intervalo de Classe fi fri 1 1000 I------- 1200 6 30% 2 1200I------- 1400 5 25% 3 1400I------- 1600 3 15% 4 1600I------- 1800 3 15% Chamamos de intervalo de classe a subdivisão dos valores da série em classes. 4 1600I 1800 3 15% 5 1800I------- 2000 3 15% classes. No exemplo acima, a classe 1 compreende os valores entre 1000 (inclusive) e 1200. Interatividade Em uma série estatística com 50 dados, o elemento 16 aparece 5 vezes. Na construção da distribuição de frequências- variável discreta, o valor da frequência relativa deste elemento será: a) 50% b) 16% c) 5% d) 20% e) 10% Tabelas de frequência e gráficos A representação gráfica das séries estatísticas tem por finalidade dar uma idéia imediata dos dados, permitindo chegar-se a conclusões sobre a evolução do fenômeno ou sobre como se l i l d é irelacionam os valores da série. Existem diversas maneiras de se representar graficamente as séries estatísticas. Cada tipo de gráfico facilita a visualização de uma determinada característica da sequência de dados. Tabelas de frequência e gráficos A fim de cumprir sua função, os gráficos devem sempre ser elaborados considerando-se alguns aspectos, entre eles: Simplicidadep Clareza Veracidade Além disso, os gráficos devem ter elementos de identificação, como títulos, escalas legendas etcescalas, legendas, etc. Tabelas de frequência e gráficos Exemplo de gráfico e seus componentes Tabelas de frequência e gráficos Gráfico em colunas (histograma de frequências) É a representação de uma série estatística por meio de retângulos, dispostos verticalmente (em colunas). Esses ( ) retângulos têm a mesma base, e as alturas são proporcionais aos respectivos dados. Tabelas de frequência e gráficos O mesmo tipo de gráfico pode também ser utilizado para representar uma série de dados de forma contínua. Como exemplo, podemos utilizar a distribuição de frequência abaixo, com as estaturas, em tí t d l d lcentímetros, dos alunos de uma escola: Tabelas de frequência e gráficos A série anterior poderia ser representada graficamente da seguinte forma: Tabelas de frequência e gráficos Uma variação do gráfico em colunas, é o gráfico em barras. Nele os retângulos são dispostos horizontalmente. Exemplo: Tabelas de frequência e gráficos Um outro tipo de gráfico amplamente utilizado é o gráfico em setores. Ele é muito empregado quando se pretende comparar cada valor da série com o valor total. Para construir este tipo de gráfico, desenha-se um círculo, dividindo-o em setores. Cada setor representa um elemento da série que queremos representar, e a área dos setores será proporcional ao valor percentual daquele elemento em relação ao valor total da série. Tabelas de frequência e gráficos Exemplo de gráfico em setores Tabelas de frequência e gráficos Gráfico em curva ou em linha Permite representar séries longas ,e auxilia na detecção de tendências e flutuações. Interatividade Qual das afirmações abaixo está incorreta, quando falamos sobre gráficos? a) Clareza é um aspecto que deve ser considerado na construção de gráficos.b) O gráfico deve ser construído com ab) O gráfico deve ser construído com a maior complexidade possível. c) O histograma representa uma série estatística por meio de retângulos. d) O gráfico em setores utiliza um circulo dividido para representar proporçõesdividido para representar proporções. e) O gráfico em linha permite detectar-se tendências em uma sequência de dados. Medidas de Posição No primeiro passo para transformar dados em informação, construímos as tabelas de frequência. Para irmos adiante em nossas análises, é preciso encontrar características que p q representem estes dados de forma ainda mais resumida. São úteis nesta tarefa as medidas de posição, também chamadas de medidas de tendência central. Medidas de Posição As medidas de posição são valores calculados para um conjunto de dados e cujo resultado representa a tendência para o centro dos dados. Uma medida de tendência central corresponde a um valor intermediário da série de dados. Corresponde também a um valor em torno do qual os dados da série estão distribuídos. As principais medidas de tendência central são a média, a mediana, e a moda. Medidas de Posição S tó i N t ã i (Σ)Somatório – Notação sigma (Σ) No cálculo das medidas de tendência central utilizaremos somas de grandes quantidades de números. Para facilitar a representação destasPara facilitar a representação destas somas, utilizamos a chamada notação sigma, representada pela letra grega Σ. Quando queremos representar a soma de diversos valores do tipo: x x x xx1, x2, x3, ...., xn Podemos utilizar a seguinte expressão: Medidas de Posição Σx1+x2+x3+....+xn = Σ xi Onde: - representa a soma das parcelas Xi – representa uma parcela genéricai p p g Medidas de Posição Exemplo: Se tomarmos a seguinte série de dados: X: 3, 5, 7, 10 Chamamos de: x1 o primeiro elemento da serie; x2 o segundo elemento da serie; etc Portanto, a somatória dos valores da série será:Σx = x +x +x +x = 3+5+7+10 = 25Σxi = x1+x2+x3+x4 = 3+5+7+10 = 25 Medidas de Posição Moda A palavra moda é utilizada cotidianamente com um significado parecido com a definição em estatística. No dia a dia dizemos que algo está naNo dia a dia, dizemos que algo está na moda se muita gente o está usando ou o está fazendo. Em estatística, moda é o valor que mais aparece no conjunto, aquele que é a característica da maioria.característica da maioria. Quando há um valor que se sobressai em frequência, com relação aos demais valores, dizemos que o conjunto tem uma moda, é modal. Medidas de Posição A Moda (mo) é, portanto, o valor de maior frequência em um conjunto de dados, ou seja é o valor que aparece mais vezes neste conjunto. Exemplo 1:p Na série X: 2; 8; 3; 5; 4; 5; 3; 5; 5; 1 o valor de maior frequência é o 5. Portanto mo = 5. Medidas de Posição Mediana(md) A mediana é uma medida de tendência central que considera não os valores intrínsecos dos dados, mas a posição que eles ocupam no conjunto de dadosq p j ordenados. A mediana de um conjunto de dados será o valor que o divide em dois subconjuntos,um contendo os 50% menores valores e o outro contendo os 50% maiores valores. É, dessa forma, considerada uma medida de posição. Medidas de Posição Mediana Exemplo: Considere a seguinte sequência de dados: X: 1; 2; 2; 3; 3; 4; 4; 4; 5; 5; 5; 5; 6; 6; 7; 7; 8 A mediana desta séries será: Medidas de Posição Determinação da Mediana Como a mediana é o elemento que divide a série de dados em duas partes iguais, ela será é determinada da seguinte forma: se a quantidade de dados for ímpar ase a quantidade de dados for ímpar, a mediana será o valor que ocupar a posição (n+1)/2; se a quantidade de dados for par, a mediana será a média dos dados que ocupam as posições n/2 e (n+2)/2.ocupam as posições n/2 e (n+2)/2. Medidas de Posição Exemplo 1: Determinar a mediana da série: X: 2; 20; 12; 23; 20; 8; 12 Ordenando estes dados, teremos o rol: X: 2; 8; 12; 12; 20; 20; 23 O número de elementos é ímpar: n= 7. A mediana será o elemento de posição = (7+1)/2 = 4o elemento da série. Portanto: Md = 12 Medidas de Posição Exemplo 2: Determinar a mediana da série: X: 7; 21; 13; 15; 10; 8; 9; 13 Ordenando estes dados, teremos o rol: X: 7; 8; 9; 10; 13; 13; 15; 21 O número de elementos é par: n= 8. As posições dos elementos centrais serão: n/2 = 4º elemento = 10 e (n+2)/2 = 5º elemento = 13 A mediana será = (10+13)/2 = 11,5 Interatividade Qual é o valor da Moda da série de dados abaixo? X: 2,3,3,5,2,7,5,2,8,9,2,10,11,2,3 a) 3 b) 2b) 2 c) 7 d) 2,5 e) 9 Medidas de Posição Média aritmética A média aritmética representa a redistribuição equitativa de todos os valores de um conjunto de dados. Por exemplo suponha que um alunoPor exemplo, suponha que um aluno obteve a nota 4,0 na primeira prova, 7,5 na segunda prova , e 6,5 na terceira prova. O total de pontos obtidos foi igual a 18. Se redistribuirmos esse valor total pelas três notas considerando o mesmo valortrês notas, considerando o mesmo valor para cada uma delas, esse valor seria 6. 6 seria, portanto a média aritmética das três notas. Medidas de Posição Para uma sequência de dados do tipo X: x1, x2, x3,...xn, a média aritmética simples, simbolizada por , será:X n xX iΣ= Exemplo: Se X: 2, 5, 10, 3, então: n 5 4 31052X =+++= Medidas de Posição Quando temos os dados agrupados na forma de uma distribuição de frequências – variável discreta, podemos calcular a média aritmética ponderada. Neste caso calculamos a média aritmética através da fórmula: i i.i f fxX Σ Σ= Medidas de Posição Exemplo: Suponha que a empresa em que você trabalha registrou o número de vezes que ligou o servidor por dia, durante o mês passado. Os dados são os seguintes:p g Então, podemos calcular o número médio de vezes que o servidor foi ligado por diade vezes que o servidor foi ligado por dia, pela fórmula: i i.i f fxX Σ Σ= Medidas de Posição =(1x1)+(2x6)+(3x5)+(4x4)+(5x4)+(6x5)+(7x3)+(8x2)X i i.i f fxX Σ Σ= =(1x1)+(2x6)+(3x5)+(4x4)+(5x4)+(6x5)+(7x3)+(8x2) 30 = 131 = 4,367 30 Portanto podemos dizer que o servidor da f i li d édi 4 367 X X empresa foi ligado em média 4,367 vezes por dia. Medidas de tendência central Propriedades da média Propriedade da soma: Somar uma constante qualquer a cada valor de um conjunto de dados irá resultar em uma nova média cujo valor é igual à médiauma nova média, cujo valor é igual à média anterior acrescida da mesma constante, ou seja: yi = xi + c ֜ Y = X + c Onde: • xi = valores do conjunto de dados X; • yi = valores do conjunto de dados Y; • c = constante אR. Medidas de tendência central Propriedade da soma Exemplo: A série X: 2,3,4,5,6 tem média X = 4. Se somarmos a cada elemento desta série a t t 2 t é iconstante c= 2, teremos a nova série: Y: 4, 5, 6, 7, 8, cuja média Y = 6 Vemos, portanto, que Y= X+2 Medidas de tendência central Propriedade do produto O produto de uma constante qualquer por cada valor de um conjunto de dados irá resultar em uma nova média, cujo valor é igual ao produto da média anterior pela g p p mesma constante, ou seja: yi = c xi ֜ Y = c X onde: xi = valores do conjunto de dados X; yi = valores do conjunto de dados Y; c = constante א R. Medidas de tendência central Propriedade do produto Exemplo: A série X: 2,3,4,5,6 tem média X = 4. Se multiplicarmos cada elemento desta é i l t t 2 tsérie pela constante c= 2, teremos a nova série: Y: 4, 6, 8, 10, 12, cuja médiaY = 8 Vemos, portanto, que Y= X . 2 Interatividade A média aritmética da seguinte série de dados X: 2, 2, 3, 8, 6, 10, 12, 13, 5, 9, é igual a: a) 70 b) 8 ) 12c) 12 d) 7 e) 10 ATÉ A PRÓXIMA!
Compartilhar