Baixe o app para aproveitar ainda mais
Prévia do material em texto
WEB AULA 1 Unidade 1 – INTRODUÇÃO À ESTATÍSTICA E ORGANIZAÇÃO DE DADOS ESTATÍSTICOS PALAVRAS-CHAVE: Estatística Descritiva, Dados Estatísticos, População, Amostra, Variáveis Quantitativas e Qualitativas, Gráficos. RESUMO: Nesta web aula serão apresentadas algumas definições básicas da estatística descritiva, os conceitos de população, amostra e as principais formas de apresentação de dados estatísticos em forma de gráficos que podem representar, de maneira sintética, as informações sobre o comportamento de variáveis numéricas levantadas por meio de processos de amostragem. A) ANÁLISE ESTATÍSTICA DE DADOS ESTATÍSTICA: A estatística é a ciências dos dados. Ela nos fornece métodos para coleta, organização, descrição, análise e interpretação de dados para a utilização deles na tomada de decisões. É objetivo da estatística: extrair informação de um conjunto de dados para obter uma melhor compreensão das situações que representam. Para melhor compreendermos os propósitos da Estatística, é necessário conhecermos as algumas definições básicas: Estatística Descritiva: Os objetivos da estatística descritiva envolvem coleta, organização e descrição de um conjunto de dados quantitativos ou qualitativos. Com a construção de gráficos, tabelas e com o cálculo de medidas com base em uma coleção de dados numéricos, poderemos compreender melhor o comportamento da variável expressa na amostra estudada. População: É a totalidade dos elementos, objetos ou pessoas que estão sendo considerados inicialmente. Amostra: É todo subconjunto de unidades retiradas de uma população para obter a informação desejada. Uma amostra tem que representar e ter as mesmas características da população original, portanto, a amostra só traz informação sobre a população da qual foi retirada. Em outras palavras, a amostra é parte da população que é selecionada para análise. A preocupação central é que a amostra seja representativa da população inicial. Atributos: Quando os dados estatísticos apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses dados são designados genericamente de estatística de atributo. Variável: É uma condição ou característica das unidades da população. Por exemplo, a idade das pessoas residentes no Brasil, ou a classe social são variáveis. As variáveis são classificadas em dois tipos: Qualitativas e Quantitativas. Variáveis qualitativas ou por atributos: Quando os dados são distribuídos em categorias mutuamente exclusivas. Seus valores são expressos por atributos: São exemplos de variáveis qualitativas: sexo, cor da pele, cidade de nascimento, tipo sanguíneo (O, A, B, AB), etc. Estas variáveis são classificadas em dois tipos: Nominal (exemplo: gênero - masculino e feminino); Ordinal (exemplo: classe social: A, B, C, D, E). Variáveis quantitativas ou numéricas: Quando os dados são de caráter nitidamente quantitativo, e o conjunto dos resultados possui uma estrutura numérica. São exemplos de variáveis quantitativas: idade, estatura, taxa de colesterol, etc. As variáveis quantitativas ou numéricas são classificadas em dois tipos: Variável Discreta: A variável discreta só pode assumir apenas valores inteiros. São exemplos de variáveis discretas: número de filhos (0, 1, 2, 3, etc.), número de estudantes em uma sala de aula, etc. Variável Contínua: A variável contínua pode assumir qualquer valor num dado intervalo. Exemplo de variável contínua: peso de uma pessoa (60,50 Kg). Dados Brutos: É uma tabela ou relação de elementos que não foram numericamente organizados. É difícil formarmos uma ideia exata do comportamento do grupo como um todo a partir de dados não ordenados ou dados brutos. Exemplo: 45, 41, 42, 41, 42 43, 44, 41, 50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51. ROL: É a tabela obtida após a ordenação dos dados brutos (de forma crescente ou decrescente).Exemplo: 41, 41, 41, 42, 42 43, 44, 45, 46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60 Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital, procure pelo livro: LARSON, R.; FARBER, B. Estatística Aplicada. 2ª Edição. São Paulo: Editora Pearson, 2008 e leia o capítulo 1 da página 2 a 6. B) APRESENTAÇÃO DE DADOS EM GRÁFICOS Gráficos ajudam a visualizar a distribuição das variáveis. Nesta etapa serão apresentadas as formas de apresentar dados em gráficos, seguindo as normas nacionais ditadas pela Fundação Instituto Brasileiro de Geografia e Estatística (IBGE). Todo gráfico deve apresentar título e escala. O títulodeve ser colocado abaixo do gráfico. As escalas devem ser crescentes da esquerda para a direita e de baixo para cima. WEB AULA 2 – NÚMEROS ÍNDICES PALAVRAS-CHAVE: números índices; números índices simples, números índices compostos, deflação de dados. RESUMO: Esta web aula possui o objetivo de apresentar os principais conceitos relacionados a números-índices, empregados nas análises de dados distribuídos sequencialmente no tempo. A) NÚMEROS ÍNDICES A análise de evolução de preços, quantidades produzidas ou vendidas e valores ao longo do tempo podem requerer diferentes procedimentos e técnicas. Números- índices representam medidas estatísticas utilizadas para resumir modificações em variáveis econômicas, ou um grupo de variáveis, facilitando o estudo da evolução de dados quantitativos ao longo do tempo, podendo assumir diferentes formas, como números-índices simples ou compostos, estes últimos empregados na análise conjunta de diferentes dados. Alguns números-índices podem ser chamados de índices econômicos quando são utilizados para medir variações ocorridas ao longo do tempo das variáveis de preços, quantidade e valor associados ao nível de custo de vida ou de preços praticados em uma economia. No Brasil, os índices mais conhecidos são o Índice Geral de Preço, calculado pela Fundação Getúlio Vargas (FGV) e o Índice Nacional de Preços ao Consumidor (INPC), calculado pelo Instituto Brasileiro de Geografia e Estatística (IBGE). NÚMEROS-ÍNDICES SIMPLES Números-índices simples podem ser de preços, quantidades ou valores, conforme será discutido a seguir. Índice Relativo de Preços (Ip): Expressam a relação entre o preço de um único produto em um período determinado e o de outro período, comumente denominado período básico ou de referência. O índice de preço relativo do período b (Pb), em relação ao do período a (Pa) pode ser definido pela seguinte equação: Exemplo: Se um produto custava R$ 40,00 em 2008 e passou a custar R$ 50,00 em 2009, o índice de preço relativo de preço entre 2009 e 2008 é expresso como: Em outro exemplo, considere os preços médios unitários da produção de certo produto durante os anos de 2004 a 2009 apresentados na Tabela 1. Adotando o ano de 2004 como base, pode-se determinar os índices de preços relativos correspondentes aos anos de 2007 e 2008. Usando a fórmula anterior, pode-se calcular o preço relativo de 2007 e 2008, adotando o ano de 2004 como base: Índice Relativo de Quantidades (Iq): Assim como podemos comparar os preços de bens/produtos, podemos também fazê-lo em relação a quantidades, quer sejam elas produzidas, vendidas ou consumidas. Se fizermos qb= quantidade de um produto na época atual e qa= quantidade desse mesmo produto na no ano base, a quantidade relativa será: Exemplo: Uma empresa produziu 46 toneladas de aço em 2011 e 69 toneladas em 2012. A quantidade relativa será calculada tomando-se o ano de 2011 como base: Ou seja, no ano de 2012 esta empresa aumentou sua produção em 50% (150- 100) em relação a 2011 (ano base). Índice Relativo de Valor (Iv): Se p for o preço de determinada mercadoria em certa época e q a quantidade produzida, vendida ou consumida desse mesmo produto na mesma época, então, o produto p x q será denominado valor total de produção (vt), de vendas ou de consumo. Sendo pte qtrespectivamente, o preço e a quantidade de um artigona época atual e po e qo, o preço e a quantidade do mesmo artigo no ano base, definimos como índice relativo de valor (Iv) a razão: Onde: vt – valor total na data atual, v0 – valor total na data de ano base. Exemplo: Uma empresa vendeu, em 2010, 1000 unidades de um produto ao preço unitário de R$ 500,00. Em 2011, vendeu 800 unidades do mesmo produto ao preço unitário de R$ 600,00. O valor relativo da venda em 2011 foi de: Em 2011, o valor das vendas foi 4% (96-100) inferior ao de 2010. Exemplo: Números-índices simples – No final do ano de 2009, certa indústria estudava a evolução de suas vendas ao longo dos seis últimos anos. As quantidades vendidas, os preços praticados e o valor das vendas de cada ano podem ser visualizados na Tabela 2. Tabela 2 – Vendas Anuais da Empresa Sejam Bem Vindos LTDA. Fonte: Adaptação de Bruni (2007). Com base na tabela anterior, a empresa constatou, obviamente, que quantidades, preços e, principalmente, os valores das vendas cresceram. Porém, gostaria de aprofundar esta análise, detalhando a evolução relativa dos crescimentos e, principalmente, o efeito sobre o valor das vendas. Uma solução bastante simples para facilitar a análise envolveria a construção de números-índices, onde a empresa poderia analisar a evolução de suas vendas ao longo do tempo. Assim, uma forma de analisar a evolução e as variações ocorridas nos dados apresentados seria construir uma tabela formada por números-índices. Neste caso, como se trata de analisar a evolução de um único produto, os números-índices são chamados de números-índices simples. Para construir as séries para preços, quantidade e valores, basta dividir todos os valores de uma no escolhido mês base, expressando os valores obtidos em porcentual, ou seja, multiplicados por 100%. Por exemplo, empregando o ano de 2004 como ano base, o índice simples de quantidade (Iq) para o ano de 2005 seria igual a (55/52)*100%, que resulta no valor de 106%. O índice simples de preço (Ip) para o ano de 2007 seria igual a (271/222)*100%, que resulta em 122%. No ano base (2004), os valores de todos os índices seriam iguais a 100%. A Tabela 3 apresenta os números-índices para os demais dados, obtidos de maneira similar as descritas. Analisando os valores apresentados na Tabela 3, a indústria facilmente perceberia que a evolução dos valores de vendas é influenciada pela evolução das quantidades e preços, sendo mais evidente a evolução das quantidades. NÚMEROS-ÍNDICES COMPOSTOS Números-índices compostos devem ser utilizados quando a evolução do preço de mais de um produto ou serviço precisa ser considerada. Diferentes cálculos com múltiplos preços, quantidades ou valores podem ser considerados. Índice de Laspeyres ou método do ano base: Dentre os métodos de números- índices compostos, o índice de Laspeyres ou método do ano base é um dos métodos para cálculo de números-índices mais utilizado na área de gestão coorporativa. Ao aplicar este método, considera-se um dos anos como ano base com preços apresentados como p0 e quantidades apresentadas como q0. Para o ano analisado assumem-se preços no ano, apresentados como pn, e quantidades, apresentadas como qn.Pode ser apresentado como índice de Laspeyres de preços, quantidades ou valores conforme veremos a seguir. Índice de preços de Laspeyres (ILp): Analisa a variação ponderada dos preços, empregando a quantidade do ano base como fator de ponderação, conforme dado pela fórmula a seguir: Para ilustrar cálculos com índices de Laspeyres, considere o exemplo das vendas de quatro produtos distintos apresentados na Tabela 4. O índice de preços de Laspeyres pondera os cálculos dos valores, empregando a quantidade de vendas do ano-base. Vejamos o cálculo na Tabela 5. Portanto, dividindo os somatórios de pn*q0 pelo valor no ano base (SP0 * Q0 = R$ 31,00), pode-se calcular os índices de preços de Laspeyres, conforme apresentado na Tabela 5. Índice de quantidade de Laspeyres (ILq): O índice de quantidades de Laspeyres analisa a variação ponderada das quantidades, empregando os preços no ano base como fator de ponderação. Os cálculos dos Índices de quantidade de Laspeyres (ILq) para o exemplo apresentado na Tabela 4 são apresentados na Tabela 6. Portanto, dividindo os somatórios de p0*qn pelo valor no ano base (SP0 * Q0 = R$ 31,00), pode-se calcular os índices de quantidade de Laspeyres conforme apresentado na Tabela 6. Índice de valor de Laspeyres (ILv): O índice de valor de Laspeyres analisa a variação nos valores, comparando o valor do ano em questão com o valor do ano- base. Podemos calcular o índice de valor de Laspeyres (ILv) dividindo o valor (V) do ano de 2013 pelo valor do ano-base 2012, igual a R$31,00, conforme apresentado na Tabela 7. WEB AULA 1 Unidade 2 – MEDIDAS ESTATÍSTICAS: MEDIDAS DE TENDÊNCIA CENTRAL O nosso objetivo aqui é a determinação e de medidas que ofereçam o posicionamento da distribuição dos valores de uma variável que desejamos analisar. São os cálculos estatísticos que representam uma série de dados orientando-nos quanto à posição da distribuição de dados, sendo que as medidas de posição mais utilizadas são: média aritmética, média ponderada, moda e mediana. Média Aritmética (): A medida de tendência central mais comum para um conjunto de dados é amédia aritmética. A média aritmética amostral de um conjunto de dados é o quociente entre a soma dos valores do conjunto e o número total dos valores, conforme indicado pela fórmula abaixo: Onde: xi são os valores da variável e n o número de valores. Exemplo 1: Encontrar a média aritmética para um conjunto de observações: 5, 1, 6, 2, 4. Solução:Temos cinco observações (n=5), então: Quando a amostra é muito grande e os dados são discretos, podem ocorrer valores repetidos. Nesse caso, é razoável organizar os dados em uma tabela de distribuição de frequências e trabalharmos comdados agrupados. Quando os dados estiverem agrupados numa distribuição de frequência, utilizaremos a média aritmética dos valores x1, x2, x3,....xn ponderados pelas respectivas frequência absolutas f1, f2, f3,..., fn, Assim: “Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por meio da fórmula” anterior, onde xi é o ponto médio da classe (AMAZONAS, 2013, p. 16). Exemplo (Cálculo da média com intervalos de classes): A Tabela 1 apresenta uma distribuição de frequência que será utilizada como exemplo de cálculo da média com dados agrupados em intervalo de classes. Nos dados da Tabela 01, aplicando a equação anterior, temos que: O valor obtido indica que a média ponderada da distribuição de frequência indicada pela Tabela 01 é 61. Média Aritmética Ponderada (): A média aritmética ponderada também é chamada de média ponderada. É empregada quando as variáveis têm diferentes importâncias relativas, ou, ainda, diferentes pesos relativos. No cálculo da média ponderada, cada valor coletado na série tem uma participação proporcional ao seu peso, isto é, proporcional à importância relativa no conjunto. A média ponderada é obtida pela soma das variáveis multiplicadas pelos seus pesos, dividida pela soma dos pesos de cada variável. Assim: Onde: = Média Ponderada xi = observações ou números da variável em estudo; pi = ponderações ou pesos da variável. Exemplo: Calcular a média aritmética ponderada dos números 10, 14, 18 e 30 sabendo-se que os seus pesos são respectivamente 1, 2, 3 e 5. RESOLUÇÃO: Mediana (Md): A mediana é o valor que ocupa a posição central do conjunto de dados ordenados (ROL), portanto, está localizada na posição central, tal que 50% dos valores são menores que amediana, e os demais 50% são maiores. Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos dispostos segundo uma ordem(crescente ou decrescente): “Quando o número de elementos (n) da série estatística for ímpar, haverá coincidência da mediana com um dos elementos da série” (AMAZONAS, 2013). Neste caso existirá um único valor de posição central, e esse valor será a mediana. Por exemplo, no conjunto de dados {2, 5, 6, 9, 10, 13, 15}, ovalor que divide a esta série em duas partes iguais é igual a 9, logo a mediana é 9. Quando o número de elementos da série estatística for par, nunca haverá coincidência da mediana com um dos elementos da série de dados. A mediana será sempre a média aritmética dos 2 elementos centrais da série de dados. Por exemplo, no conjunto de dados {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}, a mediana no exemplo será a média aritmética do 5º e 6º termos da série. Portanto, a mediana será = (2+3) / 2, ou seja, m = 2,50. Cálculo da mediana em dados agrupados em intervalos de classe (variáveis contínuas) Para se calcular a mediana em dados agrupados, devemos seguir os seguintes passos: 1º) Determinamos as frequências acumuladas (S Fi = n); 2º) Calculamos n/2; como a variável é contínua, não se preocupe se n é par ou ímpar. 3º) Marcamos a classe correspondente à frequência acumulada imediatamente superior à S Fi/2. Tal classe será a classe mediana (classe Md); 4º) Calculamos a Mediana pela seguinte fórmula: Onde: lMd = limite inferior da classe mediana; n = tamanho da amostra ou número de elementos; FAA = é a frequência acumulada da classe anterior à classe mediana. h = é a amplitude do intervalo da classe mediana. FMd = é a frequência da classe mediana. A Tabela 2 apresenta determinada distribuição amostral que será utilizada para cálculo da mediana de dados agrupados. 1°) Calcula-se n/2. Como n=58, temos que 58/2=29º elemento; 2°) Identifica-se a classe mediana (Md) pela frequência acumulada. Neste caso a classe mediana é a 3°; 3°) Neste caso: lMd = 55; n = 58; FAA= 17; h = 10; FMd = 18. Aplicando a fórmula para cálculo da mediana temos: Moda (Mo): Dentre as principais medidas de posição, destaca-se a Moda. É o valor da amostra que mais se repete; ou seja, valor que ocorre com maior frequência. A Moda quando os dados não estão agrupados: A Moda é facilmente reconhecida: basta, de acordo com definição, procurar o valor que mais se repete (AMAZONAS, 2013, p. 17). Por exemplo, no conjunto de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda é igual a 10. Há séries nas quais não exista valor modal, isto é, nas quais nenhum valor apareça mais vezes que outros. Por exemplo, o conjunto de dados {3, 5, 8, 10, 12} não apresenta moda. A série é amodal. Em outros casos, pode haver dois ou mais valores de concentração. Dizemos, então, que a série tem dois ou mais valores modais. Por exemplo, o conjunto de dados {2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9} apresenta duas modas: 4 e 7 (AMAZONAS, 2013, p. 17). Neste caso, a série é bimodal. Distribuições Simples: Quando uma tabela de distribuição de frequência apresenta grande quantidade de dados. É importante destacar a classe de maior frequência, a chamada classe modal. Essa classe mostra a área em que os dados estão concentrados. Assim, para a distribuição: A moda será 248 (maior frequência - Fi), que será indicada por Moda=248. Cálculo da Moda em valores agrupados em intervalos de classe: A classe que apresenta a maior frequência é denominada classe modal. Pela definição, podemos afirmar que a Moda, neste caso, é o valor dominante que está compreendido entre os limites da classe modal. Um dos métodos para determinação da moda é a aplicação da fórmula de CZUBER: 1°) Identifique a classe modal (aquela que possuir maior frequência). 2°)Aplicar a fórmula: Onde: l = limite inferior da classe modal d1 = frequência da classe modal – frequência da classe anterior à da classe modal d2 = frequência da classe modal – frequência da classe posterior à da classe modal h = amplitude da classe modal A Tabela 03 apresenta determinada distribuição amostral que será utilizada para cálculo da moda de dados agrupados. 1°) Identifica-se a classe modal. Neste caso, trata-se da 3° classe 2 I- 3. 2°) Neste caso: l = 2; d1=17-10=7; d2=17-8=9; h = 1. Aplicando a fórmula para cálculo da moda (fórmula de CZUBER) temos: Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital, procure pelos livros: - LARSON, R.; FARBER, B. Estatística Aplicada. 2ª Edição. São Paulo: Editora Pearson, 2008, e leia o capítulo 2 da página 47 a 57. WEB AULA 2 – MEDIDAS DE DISPERSÃO Devido à variabilidade, as medidas de tendência central, ainda que consideradas como números que têm a finalidade de representar uma série de dados, não podem por si mesmas destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto, e, portanto não bastam para descrever um conjunto de dados. As medidas de tendência central são tanto mais descritivas de um conjunto de dados quanto menor for a variabilidade. Então, quando apresentamos medidas de tendência central para descrever um conjunto de dados, devemos indicar também uma medida de variabilidade ou dispersão. Medidas de Dispersão Absoluta – Amplitude Total (A) É a diferença entre o maior e o menor valor observado no conjunto de dados, conforme segue: Exemplo: Para a série: 10,12,20,22,25,33,38, a amplitude total é dada por: Variância populacional (s2) e amostral (S2) “A variância é uma medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras” (AMAZONAS, 2013, p. 24). A definição de variância populacional (s2) é dada por: Onde: s2 indica variância populacional e lê-se “sigma” ao quadrado; = média Fi = frequência N = tamanho da população Para o caso do cálculo da variância amostral (s2) é conveniente o uso da seguinte fórmula: Onde: = média amostral, n = tamanho da amostra. Desvio Padrão populacional (s) e amostral (s) O desvio padrão é a “medida de dispersão mais geralmente empregada, pois leva em consideração a totalidade dos valores da variável em estudo. É um indicador de variabilidade bastante estável” (AMAZONAS, 2013, p. 22). O desvio padrão é a raiz quadrada da variância. Assim temos: Exemplo 1: Calcular a variância amostral (s2) e o desvio-padrão amostral (s) da seguinte distribuição amostral. Resolução (Exemplo 1): a) Cálculo da Média: Primeiramente precisamos calcular o valor da média, conforme vimos anteriormente. O cálculo detalhado da média é apresentado na Tabela 4. Portanto a média é: b) Cálculo da Variância Amostral (s2): Para calcularmos a variância amostral (s2) é preciso encontrar o valor de ådi2Fi. Para tanto, uma nova coluna deverá ser considerada na tabela anterior conforme indicado na Tabela 05. Portanto, a variância amostral (s2) é dada por: c) Cálculo Desvio-Padrão Amostral (s): , logo: Resumindo: A distribuição possui média 8,06. Isto é, seus valores estão em torno de 8,06 e seu grau de dispersão é de 1,69, dado pelo desvio-padrão amostral. Aprofundando o conhecimento: Agora sugiro que você abra a biblioteca digital, procure pelo livro GARCIA, R. - UNOPAR. Estatística. São Paulo: Editora: Pearson Education do Brasil, 2009, e leia a unidade 3 - da página 62 a 64 e 76 a 83. Medida de Dispersão Relativa: Coeficiente de Variação (CV) Trata-se de uma medida relativa de dispersão útil para comparação em termos relativos do grau de dispersão em torno da média de séries distintas. É dado por: Onde: s = desvio-padrão amostral e = média Exemplo 2: Numa empresa, o salário médio dos homens é de R$ 4000,00 com desvio padrão de R$ 1500,00, e os das mulheres é em média de R$ 3800,00 com desvio padrão de R$ 1200,00. Então: Logo, podemos concluir que, nesta empresa, os salários dos homens apresentam maior dispersão relativa que o salário das mulheres.WEB AULA 1 e 2 de Metodos Quantitativos.pdf
Compartilhar