Baixe o app para aproveitar ainda mais
Prévia do material em texto
Unidade II ESTATÍSTICA Prof. Emanuel Matos Sumário 1/2 Tabelas de frequência e seus gráficos Construção das tabelas Variável “sabor” Variável “tamanho” Variável “preço” Variável “vendas” Gráficos de tabelas de frequência Gráficos de colunas Di i l Diagramas circulares Escolha do tipo de gráfico Comentários adicionais Sumário 2/2 Medidas de posição Moda Mediana Média Média aritmética Cálculo da média para dados apresentados em intervalos Média ponderada Propriedades da média Propriedades da média Médias ponderadas da área econômica: índices de inflação Tabelas de frequência e seus gráficos As tabelas de dados brutos, embora tragam todas as características do conjunto, não permitem que tenhamos um entendimento dele, pois os dados assim dispersos somente nos permitem formar uma imagem fragmentada Tomando auma imagem fragmentada. Tomando a tabela do exemplo abaixo com apenas 12 clientes, verifica-se um amontoado de fatos sem significado, imagine em pesquisas reais! Cliente Sabor Tamanho Preço Vendas 1 maracujá pequeno 1,50 8 2 uva médio 1 75 32 uva médio 1,75 3 3 maracujá médio 2,00 9 4 maracujá grande 5,00 1 5 caju pequeno 1,35 1 6 uva grande 5,30 12 7 caju grande 4,80 6 8 maracujá médio 1,50 4 9 maracujá médio 1,75 4 10 uva pequeno 1,20 1 11 uva grande 4,95 1 12 caju médio 1,75 8 Tabelas de frequência e seus gráficos Assim sendo, para que os dados possam se converter em informação, é preciso analisá-los. Cliente Sabor Tamanho Preço Vendas 1 maracujá pequeno 1,50 8 2 uva médio 1,75 3 3 maracujá médio 2 00 93 maracujá médio 2,00 9 4 maracujá grande 5,00 1 5 caju pequeno 1,35 1 6 uva grande 5,30 12 7 caju grande 4,80 6 8 maracujá médio 1,50 4 9 maracujá médio 1,75 4 10 uva pequeno 1,20 1 11 uva grande 4,95 1 12 caju médio 1,75 8 Sabores Vendas_ Quantidade de Clientes maracujá 26 5 uva 17 4 caju 15 3 Total Geral 58 12 Construção das tabelas Para melhor compreensão, vamos construir tabelas de frequência e de frequência relativa para os dados do exemplo a respeito de vendas de suco. Cliente Sabor Tamanho Preço Vendas 1 maracujá pequeno 1 50 81 maracujá pequeno 1,50 8 2 uva médio 1,75 3 3 maracujá médio 2,00 9 4 maracujá grande 5,00 1 5 caju pequeno 1,35 1 6 uva grande 5,30 12 7 caju grande 4,80 6 8 maracujá médio 1 50 48 maracujá médio 1,50 4 9 maracujá médio 1,75 4 10 uva pequeno 1,20 1 11 uva grande 4,95 1 12 caju médio 1,75 8 Variável “sabor” O l í i iá l Os valores possíveis para essa variável são: caju, maracujá e uva. É usual chamar os valores das variáveis de x. Utilizando essa notação, teremos: x1 = caju, x2 = maracujá, x3 = uva. Pelo fato de a variável ser nominal, não há ordem específica aser nominal, não há ordem específica a ser seguida pelos valores, mas é usual nesses casos, para facilitar sua localização, ordenar os valores alfabeticamente. Dos diversos clientes, três compraram suco de caju, cinco compraram de maracujá e quatro o de uva. Sabores Quantidade de Clientes x1 = caju 3 x2 = maracujá 5 x3 = uva 4 Total Geral 12 Variável “sabor” Chamando as frequências de f, teremos: f1 = 3, f2 = 5, f3 = 4. As frequências relativas serão os valores percentuais de cada sabor. Ou seja: f1=100 * 3/12, f2 = 100 * 5/12, f3 = 100 * 4/12. Fazendo as contas e apresentando osFazendo as contas e apresentando os resultados com aproximação a partir da primeira casa decimal: f1 = 25%, f2 = 42%, f3 = 33%. Sabores Quantidade de Clientes fi(%) x1 = caju 3 25% x2 = maracujá 5 42% x3 uva 4 33% Nova organização nos mostra de maneira muito mais rápida e direta o grau de preferência dos clientes com relação ao sabor. x3 = uva 4 33% Total Geral 12 100% Variável “tamanho” Fazendo a mesma coisa para a segunda variável, teremos a tabela 3. Assim como para o caso da variável “sabor”, também aqui a distribuição de preferências dos clientes fica muito mais visível que na tabela de dados brutos Atente agoratabela de dados brutos. Atente agora para o seguinte detalhe: como a variável é ordinal, a tabela deve seguir a ordem natural dos valores, ou seja, ordena os valores do menor para o maior, assim: x1 = pequeno x2 = médio x3 = grandex1 = pequeno, x2 = médio, x3 = grande Variável “preço” – Visão 1 Empregamos o mesmo procedimento para a variável “preço”. Utilizamos os valores existentes para os preços, pois, como a variável é contínua, não é possível determinar antes os valores possíveis pois eles são inúmeros Assimpossíveis, pois eles são inúmeros. Assim procedendo, teremos construída a tabela abaixo. Note que não incluímos as frequências relativas por uma questão de concisão. Preços Quantidade de Clientes % 1,20 1 8.3% 1,35 1 8.3% 1,50 2 16.7% 1,75 3 25.0% 2,00 1 8.3% 4,80 1 8.3% 4,95 1 8.3% 5,00 1 8.3% 5,30 1 8.3% Variável “preço” – Visão 2 Como os valores das variáveis oscilam, variam entre 1,20 e 5,30, por exemplo, escolho utilizar intervalos que agrupem de 1 em 1 real. Perceba a necessidade de definir o intervalo de maneira que não haja dúvidas quanto à colocação dehaja dúvidas quanto à colocação de certo dado, razão pela qual o final de cada intervalo refere-se a 99 centavos. Com isso, temos uma nova distribuição de frequências, conforme dados da tabela abaixo.tabela abaixo. Intervalo Quantidade de Clientes % 1,00 ‐ 1,99 7 58.3% 2,00 ‐ 2,99 1 8.3% 4,00 ‐ 4,99 2 16.7% 5,00 ‐ 5,99 2 16.7% Total Geral 12 100.0% Variável “preço” – Visão 2 Intervalo Quantidade de Clientes % 1,00 ‐ 1,99 7 58.3% 2,00 ‐ 2,99 1 8.3% 4,00 ‐ 4,99 2 16.7% 5,00 ‐ 5,99 2 16.7% Total Geral 12 100.0% Intervalo Preço Quantidade de Clientes 1,00 ‐ 1,99 1,20 1 1,35 1 1,50 2 1,75 3 1,00 ‐ 1,99 Total 7 2,00 ‐ 2,99 2,00 1 2 00 ‐ 2 99 Total 12,00 ‐ 2,99 Total 1 4,00 ‐ 4,99 4,80 1 4,95 1 4,00 ‐ 4,99 Total 2 5,00 ‐ 5,99 5,00 1 5,30 1 5,00 ‐ 5,99 Total 2 Total Geral 12 Variável “preço” – Visão 3 Podemos calcular o “preço médio por sabor”, então utilizamos a variável “sabor” junto: Sabor Média de Preço caju 2.6 Por exemplo: caju 2.6 maracujá 2.4 uva 3.3 Total Geral 2.7 p O preço médio do sabor uva é de 3.3. Interatividade Quando se constrói uma tabela de dados, qual tipo de informação obtemos? a) Estatística indutiva. b) Fatos sem significado. c) Estatística descritivac) Estatística descritiva. d) Clustering. e) NDA. Variável “vendas” – Visão 1 Utilizamos finalmente um procedimento similar para a variável “vendas”, sem perdas de informação. Como a variável é discreta, podemos admitir que os valores xi serão os números inteiros entre 1 e 12, que englobam todos os dados coletadosque englobam todos os dados coletados. Desse modo, construímos a tabela. Assim, sabemos vendas por clientes: Vendas Quantidade de Clientes 1 4 2 0 3 1 4 24 2 5 0 6 1 7 0 8 2 9 1 10 0 11 0 12 1 Total Geral 12 Variável “vendas” – Visão 2 Podemos ainda da mesma forma calcular por intervalos e também utilizando uma outra variável: Vendas Quantidade de Clientes 1 4 2 0 3 1 4 2 5 0 6 1 7 0 8 2 9 1 10 0 11 0 Sabor Soma de Vendas caju 15 11 0 12 1 Total Geral 12 j maracujá 26 uva 17 Total Geral 58 Gráficos de tabelas de frequência A apresentação de dados estatísticos utiliza-se não somente de tabelas, mas também de gráficos. O objetivo de uma apresentação gráfica é tornar as características importantes visíveis em um tempo bastante curto Essa característicatempo bastante curto. Essa característica dosgráficos é que torna sua utilização tão frequente na apresentação de conjuntos de valores, principalmente quando se discutem aspectos técnicos, por exemplo, nos cadernos de economia dos jornais.nos cadernos de economia dos jornais. A escolha apropriada do tipo de gráfico dependerá das características do conjunto que se queira enfatizar. Gráfico de colunas Os gráficos de colunas são construídos tendo como eixo horizontal os valores da variável e na vertical, a frequência. Assim sendo, as colunas serão tanto mais altas quanto maior a frequência daquele valor. E l áfi d l d iá l Exemplo: gráfico de colunas da variável “sabor”. Gráfico de colunas Da mesma forma, podemos fazer gráfico de coluna para dados intervalares. Variável preço. Diagramas circulares Os diagramas circulares são construídos de tal modo que quanto maior a proporção de uma categoria no conjunto, maior será a área do círculo que se refere a ela, sendo que a categoria pode referir se a um valor ou a um intervalo dereferir-se a um valor ou a um intervalo de valores. Devido aos cortes radiais que definem fatias da circunferência, esses gráficos também são conhecidos por “gráficos de pizza”. Diagramas circulares Por sua natureza, são bastante utilizados nos casos em que mostrar a quantidade específica de cada categoria não é importante, mas sim mostrar clara e rapidamente as proporções de cada uma. Como exemplo, utilizaremos as mesmas tabelas de frequência para as quais fizemos os gráficos de coluna. Diagramas circulares Similarmente podemos construir também para intervalos: Escolha do tipo de gráfico Como dissemos no início desta seção, o papel de um gráfico é trazer alguma informação de maneira clara e direta, logo, o critério para se escolher um gráfico ou outro quando vamos apresentar dados depende de qual é o objetivo dessa figuradepende de qual é o objetivo dessa figura em nossa argumentação. Ou seja, se quisermos enfatizar os valores específicos de cada frequência para cada variável, o gráfico mais apropriado será o de colunas; no entanto, se for interessantecolunas; no entanto, se for interessante enfatizar a proporção de cada um, devemos utilizar o diagrama circular. Comentários adicionais 1/2 Apresentamos aqui somente dois tipos de gráficos, por considerá-los os mais significativos para as discussões de interesse da disciplina. No entanto, existem diversos outros tipos, mas a lógica de construção que os regemas a lógica de construção que os rege é geralmente derivada da mesma lógica de construção dos tipos vistos aqui. Portanto, não deve haver dificuldade na compreensão ou na construção de algum outro formato.algum outro formato. Comentários adicionais 2/2 Note ainda que atualmente é raro que tenhamos que construir gráficos manualmente, visto que todas as planilhas de dados já possuem ferramentas de elaboração dos gráficos em diversos formatos e ainda háem diversos formatos e ainda há programas específicos de excelente qualidade desenvolvidos para esse fim. Medidas de posição Moda Mediana Média Moda A palavra moda é utilizada por nós cotidianamente com um significado parecido com a definição de estatística. No dia a dia, dizemos que algo está na moda se muita gente o está usando ou o está fazendo Em estatística modaou o está fazendo. Em estatística, moda é o valor que mais aparece no conjunto, aquele que é a característica da maioria. Quando há um valor que se sobressai em frequência, com relação aos demais valores, dizemos que o conjuntovalores, dizemos que o conjunto tem uma moda, é modal. Moda: exemplo Exemplo: Tipo Quantidade Impressora jato de tinta 112 Impressora laser monocromática 263 Impressora laser colorida 185 Multifuncional jato de tinta 488 Multifuncional laser monocromática 124 Multifuncional laser colorida 93 Vemos que o artigo que mais aparece é a multifuncional jato de tinta, com 488 unidades. Um erro comum é atribuir à moda a frequência do valor, mas ressalto Multifuncional laser colorida 93 Total 1265 que a moda será o valor da variável e não a quantidade de vezes que o mesmo aparece. Ou seja, a moda desse conjunto será, portanto, “multifuncional jato de tinta”. Interatividade Dada a tabela abaixo, qual é o valor modal? Tipo Quantidade Impressora jato de tinta 112 Impressora laser monocromática 488 Impressora laser colorida 185 Multifuncional jato de tinta 488 Multifuncional laser monocromática 124 Multifuncional laser colorida 93 a) Impressora jato de tinta. b) Impressora laser colorida. c) Impressora laser colorida e monocromática. Multifuncional laser colorida 93 Total 1490 monocromática. d) Impressora jato de tinta e impressora laser monocromática. e) NDA. Mediana A segunda grandeza que utilizaremos como um resumo do conjunto é a mediana, que definimos como sendo o valor que corresponde ao ponto central do conjunto. A mediana é o valor que divide o conjuntoA mediana é o valor que divide o conjunto em duas metades, isto é, haverá um mesmo número de valores inferiores e superiores ao valor da mediana. A mediana é uma métrica posicional. Mediana A mediana é uma métrica posicional. Exemplo: tomemos estes indivíduos: Nome Idade Ana 3 Bruno 32Bruno 32 Denise 19 Gabriel 56 José 12 Maria 16 Pedro 11 Qual será a mediana? Pedro 11 Mediana: exemplo 1 Por ser posicional, devemos ordenar e observar o valor do meio: Nome Idade Ana 3 Bruno 32 Denise 19 Nome Idade Ana 3 Pedro 11 José 12 A mediana será a idade que divide o Denise 19 Gabriel 56 José 12 Maria 16 Pedro 11 José 12 Maria 16 Denise 19 Bruno 32 Gabriel 56 A mediana será a idade que divide o conjunto em dois, ou seja, a idade acima e abaixo da qual haverá o mesmo número de pessoas. A mediana é 16. Mediana: exemplo 2 Vamos retirar um indivíduo, a própria Maria, e recalcular a mediana: Nome Idade Ana 3 Bruno 32 Denise 19 Nome Idade Ana 3 Pedro 11 José 12 Nesse caso, a mediana estará entre José e Denise, devemos calcular o ponto Denise 19 Gabriel 56 José 12 Pedro 11 José 12 Denise 19 Bruno 32 Gabriel 56 , p intermediário entre esses indivíduos. Tomemos as idades 12+19 = 31, dividimos por 2 e temos a mediana = 15.5. Mediana: exemplo 3 Em um gráfico de colunas com intervalos, onde os intervalos já estão ordenados, onde será a mediana? Mediana: exemplo 3 Em um gráfico de colunas com intervalos, onde os intervalos já estão ordenados, a mediana será? Moda: exemplo 4 Em um gráfico de colunas com intervalos, onde os intervalos já estão ordenados ou não, onde será a moda? Moda: exemplo 4 Em um gráfico de colunas com intervalos, a moda será? Cálculo manual da mediana 1/3 Encontrar a mediana de um grupo de n números é fácil, desde que você se lembre de ordenar os valores primeiro. Se n for ímpar, a mediana é o valor do meio. Contando a partir dos finais, encontramos esse valor na posição (n + 1)/2. Quando n for par, existem dois valores do meio. Assim, nesse caso, a mediana é a médiaAssim, nesse caso, a mediana é a média dos dois valores nas posições n/2 e (n/2) + 1. Cálculo manual da mediana 2/3 Veja dois exemplos: Suponha que o grupo tenha os valores 14,1; 3,2; 25,3; 2,8; –17,5; 13,9 e 45,8. Primeiro ordenamos os valores: –17,5; 2,8; 3,2; 13,9; 14,1; 25,3 e 45,8. Visto que existem 7 valores, a mediana é o valor na posiç̧ão (7 + 1)/2 = 4, contanto do início ou do fim: 13,9. Cálculo manual da mediana 3/3 “Suponha que temos o mesmo grupo com outro valor em 35,7. Então, os valores ordenados são –17,5;2,8; 3,2; 13,9; 14,1; 23,3; 35,7 e 45,8. A mediana é a média dos valores nas posições 8/2 = 4 e (8/2) + 1 = 5. Portanto, a mediana é (13,9 +14,1)/2 = 14,0”. (R., SHARPE, Norean; De VEAUX, Richard D.; VELLEMAN, Paul F. “Estatística Aplicada: Administração, Economia e Negócios”. Bookman, 2011-01-01. e egóc os oo a , 0 0 0 <vbk:9788577808656#page(153)>) Interatividade Os dados representam as idades, em anos, completos de todas as crianças de uma sala de aula. Dados: 1 0 4 4 3 1 0 4 5 2 4 Qual é a mediana?Qual é a mediana? a) 0 b) 4 c) 3 d) 2.5) e) NDA. Média As medidas de posição dadas anteriormente podem traduzir algumas características interessantes dos conjuntos estudados, mas não permitem um estudo analítico mais profundo. Para que isso seja feito é preciso definirPara que isso seja feito, é preciso definir uma terceira medida de posição do conjunto que é a média. Assim como outros conceitos, também o de média faz parte de nossa linguagem cotidiana pois costumamos realizar comcotidiana, pois costumamos realizar com bastante frequência cálculos de médias, ainda que de maneira informal e intuitiva. Média Imagine a seguinte situação: um grupo de amigos organiza um jantar e cada um fica responsável por realizar parte das compras. Ao final, cada um deles comunica o valor gasto e eles dividem igualmente as despesasigualmente as despesas. O valor da contribuição de cada um para a festa é justamente a média de gastos do grupo. Média aritmética A chamada média aritmética, média ou média simples, é a mais utilizada no cotidiano e estabelece que todos os elementos têm a mesma importância. Pessoa Gasto Alberto 25 Beatriz 31 Carlos 47Carlos 47 Diana 19 Edgar 28 Média aritmética: exemplo Gastos efetuados para a realização do jantar por participante do grupo de amigos. Pessoa Gasto Alberto 25 Beatriz 31 C l 47 Dessa maneira, determinamos que a Carlos 47 Diana 19 Edgar 28 , q média de gastos foi de R$ 30,00, ou seja, esse é o valor correspondente aos gastos de cada um. É interessante observar que o valor da média não precisa ser um valor encontrado no conjunto. Regra geral – média aritmética Utilizando o exemplo como guia, vamos agora formalizar o cálculo da média aritmética. Utilizamos um indicador de que temos que somar todos os valores de xi. A isso chamamos “somatório de x”, ou seja, soma de todos os valores de x. Para indicar tal operação, convencionou-se utilizar a letra grega sigma maiúscula, como segue: Média aritmética – frequência Passamos agora a discutir o cálculo da média quando os dados estão apresentados em uma tabela de frequência. Para isso, começaremos calculando a média da mesma maneira utilizada anteriormente mas agora parautilizada anteriormente, mas agora para uma situação ligeiramente diferente. Média aritmética – frequência Suponhamos agora que haja uma mesa com 10 pessoas em uma lanchonete, as quais combinaram dividir igualmente a despesa final. Os dados a respeito do consumo de cada um dos ocupantes estão apresentados na tabela:estão apresentados na tabela: Pessoa Gasto 1 12 2 15 3 15 4 18 5 13 6 12 7 13 8 15 9 12 10 15 Média aritmética – frequência Gastos efetuados por ocupante da mesa da lanchonete. Pessoa Gasto 1 12 2 15 3 15 4 18 5 13 6 12 Temos aqui como valores xi os gastos individuais e como fi o número de pessoas que gastou esse valor. 6 12 7 13 8 15 9 12 10 15 xi fi 12 3 13 2 15 4 18 1 Total Geral 10 Média aritmética – frequência Gastos efetuados por ocupante da mesa da lanchonete. xi fi 12 3 13 2 15 4 Para calcular a média, precisamos, em primeiro lugar, do número de pessoas, que é o somatório das frequências, 15 4 18 1 Total Geral 10 na tabela acima = total geral. O segundo valor a ser determinado é o valor total da conta. Média aritmética – frequência O segundo valor a ser determinado é o valor total da conta. 3 pessoas gastaram 12, somam-se 36 à conta. 2 pessoas gastaram 13, somam-se 26 à conta. 4 pessoas gastaram 15, somam-se 60 à conta. 1 pessoa gastou 18, somam-se 18 à conta. C d f ê i dá t t l xi fi xi . Fi Média / pessoa 12.00R$ 3 36.00R$ 13.00R$ 2 26.00R$ 15.00R$ 4 60.00R$ 18.00R$ 1 18.00R$ Total Gera 10 140.00R$ 14.00R$ Como a soma das frequências nos dá o total de pessoas na mesa, que são 10, temos uma conta de R$ 140,00 a ser dividida por 10 pessoas. A média, portanto, será de R$ 14,00. Cálculo da média para dados apresentados em intervalos Quando a tabela de frequências traz classes de dados em intervalos em lugar de valores individuais, assumimos que o valor que melhor representa a classe é o valor referente ao meio do intervalo. Intervalo xi Tomando como exemplo os intervalos da tabela acima, os intervalos teriam por valores representativos: Intervalo xi 1.0 ‐ 5.0 3 6.0 ‐ 10.0 8 11.0 ‐ 15.0 13 O intervalo 1-5 tem como valor representativo x1 = 3, o intervalo 6-10 tem como valor representativo x2 = 8, o intervalo 11-15 tem como valor representativo x3 = 13. Cálculo da média para dados apresentados em intervalos Como os valores tratados dessa maneira não consideram exatamente o valor de cada um dos dados, a média será um valor aproximado. Portanto, quando houver acesso aos dados brutos e também necessidade de um cálculotambém necessidade de um cálculo preciso, é preferível utilizar os dados brutos para efetuar o cálculo da média. Intervalo xi fi xi*fi Média 1.0 ‐ 5.0 3 7 21 6 0 ‐ 10 0 8 4 326.0 ‐ 10.0 8 4 32 11.0 ‐ 15.0 13 1 13 Soma 12 66 5.5 Média ponderada Pensemos no seguinte exemplo cotidiano: para avaliar o desempenho de um aluno, é usual que se utilize mais de um instrumento de apreciação. Digamos que um professor aplique duas avaliações no bimestre: a primeira seria um trabalho em grupo a respeito de algum tópico desenvolvido em aula e a segunda seria uma prova a respeito de todo o conteúdo. Média ponderada: exemplo Tomando o exemplo das notas, digamos que o professor assuma que a prova é quatro vezes mais importante que o trabalho, ele então atribuirá peso 1 ao trabalho e peso 4 à prova. C A B Média Ponderada n1 n2 p1 p2 p1 + p2 n1*p1 n2*p2 (A+B)/C Notas Ponderação Aluno n1 n2 p1 p2 p1 + p2 n1 p1 n2 p2 (A+B)/C 1 0 10 1 4 5 0 40 8.00 2 10 0 1 4 5 10 0 2.00 3 8 2 1 4 5 8 8 3.20 4 2 8 1 4 5 2 32 6.80 5 7 7 1 4 5 7 28 7.00 6 9 6 1 4 5 9 24 6.60 Médias ponderadas da área econômica: índices de inflação Os índices econômicos são geralmente uma ponderação de diversos dados com pesos diferentes. Exemplos de índices de preços. Propriedades da média Para terminar nossa discussão a respeito das médias, vale comentar duas de suas características: 1. Se somarmos um mesmo número a todos os elementos do conjunto, a média será acrescida de mesmo valor. 2. Se multiplicarmos todos os elementos do conjunto por um mesmo número, a média será acrescida de mesmo valor. Interatividade Qual é o valor mais aproximado da média dos dados abaixo? 1 1 1 1 2 2 2 3 3 a) 1.0 b) 2 1b) 2.1 c) 3.0 d) 1.8 e) NDA. ATÉ A PRÓXIMA!
Compartilhar