Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO TÓPICO 1 ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO ഥX = σi=1 n Xi n μ = σi=1 n Xi n Razão entre a soma dos valores dos dados e o número total de observações Exemplo 1: Considere os tamanhos de classe para uma amostra de cinco classes universitárias U = {46,54,42,46,32} Exemplo 2: Considere o conjunto A = {2,3,5,6,7,10} 1.1 Medidas de posição ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO G = 𝑛 ෑ 𝑖=1 𝑛 𝑋𝑖 A média geométrica de n valores não-negativos (X1, X2, … , Xn) é: Exemplo 1: U = {46,54,42,46,32} Exemplo 2: A = {2,3,5,6,7,10} 1.1 Medidas de posição Para qualquer conjunto de n valores não-negativos, temos G ≤ ഥX, com G = ഥX se, e somente se, os n valores forem todos iguais O logaritmo da média geométrica é igual à média aritmética dos logaritmos dos valores observados log G = 1 n i=1 n log Xi ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO A média harmônica de n valores diferentes de zero, (X1, X2, … , Xn) é o inverso da média aritmética dos inversos dos valores observados: H = 1 n i=1 n Xi −1 −1 Exemplo 1: U = {46,54,42,46,32} Exemplo 2: A = {2,3,5,6,7,10} Para qualquer conjunto de n valores positivos, temos H ≤ G, com H = G se, e somente se, os n valores forem todos iguais 1.1 Medidas de posição ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Valor central quando os dados estão organizados de maneira crescente Valor que ocorre com mais frequência Nº ímpar de observações: valor que ocupa a posição central Nº par de observações: média dos dois valores centrais Exemplo 1: U = {46,54,42,46,32} Exemplo 2: A = {2,3,5,6,7,10} 1.1 Medidas de posição ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Valor tal que, quando os dados estão organizados de maneira crescente, pelo menos 𝑝 por cento das observações são menores ou iguais a esse valor e pelo menos 100 − 𝑝 por cento das observações são maiores ou iguais a esse valor i = p 100 × n Se 𝑖 não for um nº inteiro, arredonde-o para cima. O próximo inteiro maior do que 𝑖 denota a posição do p-ésimo percentil. Se 𝑖 for um nº inteiro, o p-ésimo percentil será a média dos valores que ocupam a posição 𝑖 e 𝑖 + 1 Exemplo 1: U = {32,42,46, 46,54} Exemplo 2: A = {2,3,5,6,7,10} 1.1 Medidas de posição ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO São usados para dividir um conjunto de dados em quatro partes, cada uma delas contendo aproximadamente 25% dos dados Q1 1º quartil, ou 25º percentil Q2 2º quartil, ou 50º percentil (também é a mediana) Q3 3º quartil, ou 75º percentil Exemplo 1: U = {32,42,46, 46,54} Exemplo 2: A = {2,3,5,6,7,10} 1.1 Medidas de posição ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO = Maior Valor − Menor valor Diferença entre 𝑄3 (3º quartil ) e 𝑄1 (1º quartil ). Corresponde aos 50% dos dados intermediários IQR = Q3 − Q1 Atenção: medida altamente influenciada por valores extremos Exemplo 1: U = {32,42,46, 46,54} Exemplo 2: A = {2,3,5,6,7,10} 1.2 Medidas de variabilidade ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Desvios dos valores ao redor da média elevados ao quadrado σ2 = σi=1 n (Xi−μ) 2 n s2 = σi=1 n (Xi−ഥX) 2 n − 1 Exemplo 1: U = {32,42,46, 46,54} Exemplo 2: A = {2,3,5,6,7,10} Atenção: por estar elevada ao quadrado, é difícil a compreensão e interpretação intuitiva em torno do valor numérico da variância. Por que, então, elevamos ao quadrado? 1.2 Medidas de variabilidade ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Raiz quadrada positiva da variância σ = σ2 s = s2 Razão entre o DP e a média, multiplicado por 100. CV = DesvioPadrão Média × 100 Exemplo 1: U = {32,42,46, 46,54} Exemplo 2: A = {2,3,5,6,7,10} 1.2 Medidas de variabilidade ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Se tivermos n observações da variável, nas quais 𝑤1 são iguais a 𝑋1, 𝑤2 são iguais a 𝑋2 etc., 𝑤𝑛 iguais a 𝑋𝑛. Então a média (também chamada de média ponderada) pode ser escrita como: ഥX = σi=1 n wiXi σi=1 n wi Xi = valor da observação i wi = frequência absoluta da observação i 1.3 Média ponderada e o trabalho com dados agrupados σi=1 n wi = n é o tamanho da amostra/população fi = wi n é a frequência relativa da observação Xi Logo, a média ponderada pode ser escrita como: ഥX = i=1 n fiXi ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO AQUISIÇÃO CUSTO POR KG (R$) Nº DE KG 1 3,00 1.200 2 3,40 500 3 2,80 2.750 4 2,90 1.000 5 3,25 800 1.3 Média ponderada e o trabalho com dados agrupados Exemplo 3: Considere a aquisição de 5 matérias primas usadas na produção. Qual é o custo médio da matéria prima utilizada? Também podemos calcular a variância: σ2 = σi=1 n wi(Xi−ഥX) 2 σi=1 n wi ou σ2 = i=1 n fi(Xi−ഥX) 2 ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO 1.3 Média ponderada e o trabalho com dados agrupados Exemplo 4: Quer se estudar o número de erros de impressão de um livro. Para isso escolheu-se uma amostra de 50 páginas, encontrando-se o número de erros por página da tabela abaixo. a) Qual o número médio de erros por página? b) E o número mediano? c) Qual é o desvio padrão? d) Se o livro tem 500 páginas, qual o número total de erros esperados no livro? Erros Nº de páginas 0 25 1 20 2 3 3 1 4 1 ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Aqueles exibidos em intervalos de classe ഥX = σi=1 n wiMi n Mi = ponto médio da classe i wi = frequência absoluta da classe i Média: Variância amostral: s 2 = σi=1 n wi Mi − ഥX 2 n − 1 1.3 Média ponderada e o trabalho com dados agrupados Exemplo 5: Distribuição de frequência amostral do tempo, em dias, necessário para a conclusão de auditorias de fim de ano realizadas pela empresa de contabilidade Sanderson e Clifford.10-14 4 15-19 8 20-24 5 25-29 2 30-34 1 TEMPO P/CONCLUSÃO DAS AUDITORIAS (DIAS) FREQUÊNCIA ABSOLUTA σi=1 n wi = n é o tamanho da amostra/população ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO 35 40 45 50 55 60 65 0 1 2 3 4 5 6 SEMA NA Nº DE COMERC (𝑿𝑰) VENDAS (R$ 100) (𝒀𝑰) 1 2 50 2 5 57 3 1 41 4 3 54 5 4 54 6 1 38 7 5 63 8 3 48 9 4 59 10 2 46 Primeiramente, deve-se fazer um gráfico de dispersão para averiguar se existe alguma relação entre os dados 1.4 Medidas de associação entre duas variáveis Muitas vezes o tomador de decisões está interessado na relação entre duas variáveis. Exemplo 6: O gerente da loja quer saber a relação entre comerciais de TV no fim de semana e vendas na semana seguinte. Para isso, ele conta com uma amostra de 10 semanas. ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Covariância Amostral𝑠𝑋𝑌 = σ𝑖=1 𝑛 (𝑿𝑰 − ഥ𝑿)(𝒀𝑰 − ഥ𝒀) 𝑛 − 1 Covariância Populacional 𝜎𝑋𝑌 = σ𝑖=1 𝑛 (𝑿𝑰 − 𝝁𝑿)(𝒀𝑰 − 𝝁𝒀) 𝑁 Medidas de Associação Linear: Covariância e Correlação Correlação Amostral 𝑟𝑋𝑌 = 𝑠𝑋𝑌 𝑠𝑋𝑠𝑌 Correlação Populacional 𝜌𝑋𝑌 = 𝜎𝑋𝑌 𝜎𝑋𝜎𝑌 1.4 Medidas de associação entre duas variáveis ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Interpretando: Covariância 1.4 Medidas de associação entre duas variáveis 35 40 45 50 55 60 65 0 1 2 3 4 5 6 III IVIII Em I: 𝑋𝑖 > ത𝑋 e 𝑌𝑖 > ത𝑌, portanto, 𝑋𝐼 − ത𝑋 𝑌𝐼 − ത𝑌 > 0. Em II: 𝑋𝑖 < ത𝑋 e 𝑌𝑖 > ത𝑌, portanto, 𝑋𝐼 − ത𝑋 𝑌𝐼 − ത𝑌 < 0. Em III: 𝑋𝑖 < ത𝑋 e 𝑌𝑖 < ത𝑌, portanto, 𝑋𝐼 − ത𝑋 𝑌𝐼 − ത𝑌 > 0. Em IV: 𝑋𝑖 > ത𝑋 e 𝑌𝑖 < ത𝑌, portanto, 𝑋𝐼 − ത𝑋 𝑌𝐼 − ത𝑌 < 0. Assim, se 𝑠𝑋𝑌 > 0, então os pontos que exercem maior influência sobre 𝑠𝑋𝑌 estão nos quadrantes I e III. Sugestão de associação linear positiva. Por outro lado, se 𝑠𝑋𝑌 < 0, então os pontos que exercem maior influência sobre 𝑠𝑋𝑌 estão nos quadrantes II e IV. Sugestão de associação linear negativa. ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Interpretando: Correlação 1.4 Medidas de associação entre duas variáveis Teremos, sempre, −1 ≤ 𝑟𝑋𝑌≤ 1. Se 𝑟𝑋𝑌 = 1 correlação perfeita (positiva). Se 𝑟𝑋𝑌 = −1 correlação perfeita (negativa). Quanto mais próximo 𝑟𝑋𝑌 de 1 ou −1, mais forte a correlação entre 𝑋 e 𝑌. Se 𝑟𝑋𝑌 = 0, não há correlação entre os dados. Se 𝑟𝑋𝑌 for muito próxima a zero, a correlação é baixa. Atenção: CORRELAÇÃO NÃO IMPLICA CAUSALIDADE. Exemplo: podemos descobrir que a avaliação da qualidade e o preço de um prato típico vendido em um restaurante estão positivamente correlacionadas. Isso não implicará que que simplesmente aumentar o preço em um restaurante fará a qualidade se elevar. ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO 1.4 Medidas de associação entre duas variáveis Correlações Espúrias Fonte: http://www.tylervigen.com/spurious-correlations ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO 1.4 Medidas de associação entre duas variáveis Correlações Espúrias Fonte: http://www.tylervigen.com/spurious-correlations ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO 1.4 Medidas de associação entre duas variáveis Correlações Espúrias Fonte: http://www.tylervigen.com/spurious-correlations ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO 1.4 Medidas de associação entre duas variáveis Correlações Espúrias Fonte: http://www.tylervigen.com/spurious-correlations ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Regra dos cinco itens Menor Valor Primeiro Quartil (Q1) Mediana (Q2) Terceiro Quartil (Q3) Maior Valor Box Plot Passo 1: ordenar os dados e encontrar os 5 itens; Passo 2: desenhe um retângulo cujas extremidades são Q1 e Q3; Passo 3: Marcação da mediana; Passo 4: 1,5 × IQR determina os limites do gráfico (imaginário). Dados fora desse limite são outliers, marque-os; Passo 5: Construção das hastes. Das bordas até o menor/maior valor dentro dos limites. 1.5 Outras medidas Exemplo 7: Salários mensais iniciais de uma amostra de 12 graduados em administração. Graduado Salário Mensal (R$) Graduado Salário Mensal (R$) 1 3.450 7 3.490 2 3.550 8 3.730 3 3.650 9 3.540 4 3.480 10 3.925 5 3.355 11 3.520 6 3.310 12 3.480 ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Box Plot (Exemplo 7) 1.5 Outras medidas ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Salários iniciais por Setor (amostra com 111 recém-formados) 1.5 Outras medidas ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Forma da Distribuição: Assimetria Assimetria à direita (positiva) Simetria Assimetria à esquerda (negativa) Média = Mediana = ModaMédia > Mediana > Moda Média < Mediana < Moda 1.5 Outras medidas O box plot dá uma ideia da posição (mediana), dispersão (IRQ), assimetria (posições relativas de 𝑄1, 𝑄2 e 𝑄3), causas (hastes) e dados discrepantes Para o Exemplo 7: 3200 3300 3400 3500 3600 3700 3800 3900 4000 Média (3.540) > Mediana (3.505) > Moda (3.480) ESTATÍSTICA I | UDESC-ESAG | CIÊNCIAS ECONÔMICAS | 2º TERMO | PROFª DRª THAIS WAIDEMAN NIQUITO Referências • SWEENEY, Dennis J., WILLIANS, Thomas A. e ANDERSON, David R. Estatística Aplicada à Administração e Economia. 3ª ed. São Paulo: Cengage Learning, 2013. (Capítulo 3). • HOFFMANN, Rodolfo. Estatística para Economistas. 4ª ed. São Paulo: Pioneira Thomson Learning, 2006. (Capítulos 4 e 5). • BUSSAB; MORETTIN. Estatística básica. 5ª edição. São Paulo: Saraiva, 2004 (Capítulo 3). Obrigada!
Compartilhar