Baixe o app para aproveitar ainda mais
Prévia do material em texto
Universidade Presbiteriana Mackenzie ESTATÍSTICA APLICADA I PROFESSORA: Grácia Maria Catelli Anacleto 1. CONCEITOS BÁSICOS: A estatística é a ciência que tem como objetivo fornecer subsídios para o planejamento e a execução de experimentos, bem como para a coleta, a descrição e a análise de dados e para a interpretação de resultados. Nesse contexto a estatística pode ser dividida em duas partes: ESTATÍSTICA DESCRITIVA: Que trata da descrição tabular, gráfica e paramétrica (relativo a parâmetro) dos dados provenientes de populações e amostras. Na verdade ela é a parte da estatística que se fundamenta por apenas descrever o comportamento dos dados, sem tirar inferências sobre os mesmos. ESTATÍSTICA INFERENCIAL: Parte dos resultados obtidos nas amostras e faz inferências para a população. Estuda a estimação e os testes sobre os parâmetros populacionais. Inferência Estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informações de uma amostra. Para se analisar os dados de forma estatística podem-se obter os resultados de duas maneiras: através de um censo ou através de uma amostragem (pesquisa em uma amostra). POPULAÇÃO: Em termos estatísticos define-se uma população como sendo um conjunto de informações que tenham, pelo menos, uma característica em comum. Exemplos: Moradores de Porto Alegre; Peças produzidas por uma máquina; Consumidores de uma marca de sabão em pó; Empresas produtoras de peças para relógios; Lagartas em uma plantação de soja; Contribuintes para a receita estadual. etc. Uma população pode ainda ser caracterizada como sendo: FINITA: É aquela população que podemos enumerar todos os seus elementos (podem ser totalizados e expressos por uma quantidade definida). Exemplo: Número de eleitores no município de Porto Alegre; Número de empresas cadastradas na Junta Comercial. etc. INFINITA: É quando a quantidade de elementos da população não pode ser expressa por uma quantidade definida de valores. Mesmo que esta quantidade exista mas não possa ser contada por ser incomensurável. Exemplo: Peças produzidas por uma linha de produção que trabalhe 24 horas por dia. Nesse caso o tamanho da população é sempre incrementado a cada dia; Quantidade de plantas em uma mata nativa. A quantidade é tão grande que pode ser considerada infinita. Parâmetro: São medidas obtidas através dos elementos da população. Os símbolos são apresentados por letras grega.: µ = Média, σ² = Var. absoluta; σ = Desvio Padrão. Estatísticas Amostrais ou Estatísticas: São medidas obtidas através dos elementos das amostras.: Média da Amostra = X; Variância = S²;Desvio padrão amostral = S 1 2. ESTATÍSTICA DESCRITIVA 2.1. VARIÁVEIS E ATRIBUTOS Na investigação estatística de dados uma definição muito utilizada é a variável. Define-se variável como o resultado de um experimento. As variáveis podem ser: VARIÁVEIS QUALITATIVAS: São aquelas usadas para descrever qualidades, categorias, etc. São também definidas como ATRIBUTOS. Exemplos: Sexo: Masculino e feminino. Cor dos olhos: Verde, azul, preto, castanho, etc. Classe de renda: Alta, média e baixa, etc. VARIÁVEIS QUANTITATIVAS: São aquelas que descrevem quantidades e, deste modo, podem ser comparadas a conjuntos numéricos. Podem ser classificadas em discretas e contínuas. Variáveis discretas: São as variáveis usadas para descrever dados discretos, ou seja, apenas assumem valores inteiros, pois é oriunda de uma contagem. Exemplos: Número de filhos por casais; Número de Fiscais do Tesouro do Estado por setor; Quantidade de desempregados na região, etc. Variáveis contínuas: São usadas para descrever dados contínuos, ou seja, podem assumir valores não inteiros, pois são oriundas de uma medição. Exemplos: Renda familiar; Preço de um produto; Peso, altura, etc. 2.2. DISTRIBUIÇÃO DE FREQÜÊNCIA Organização de dados estatísticos: Os dados estatísticos coletados podem ser apresentados em forma tabular (através de tabelas ) ou gráfica (através de gráficos ). Podem também ser classificados em séries estatísticas de dados grupados ( distribuições de freqüências: por intervalos e por pontos ) ou não grupados ( séries temporais, históricas e geográficas ). Antes de apresentar os dados nas mais diferentes formas cabe descrever quais são as normas técnicas de apresentação. NORMAS PARA APRESENTAÇÃO TABULAR DE DADOS Tabela é um quadro, não fechado nas extremidades, que resume um conjunto de observações. Uma tabela compõem-se de: a. corpo – conjunto de linhas e colunas que contêm informações sobre a variável em estudo; b. cabeçalho – parte superior da tabela que especifica o conteúdo das colunas; c. coluna indicadora – parte da tabela que especifica o conteúdo das linhas; d. casa ou célula – espaço destinado a um só número; e. título – conjunto de informações, as mais completas possíveis, respondendo às perguntas: O quê?, Quando?, Onde?, localizado no topo da tabela; 2 f. fonte – indicação da entidade responsável pelo fornecimento dos dados ou pela sua elaboração. Séries Estatísticas Denomina-se de séries estatísticas toda tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. Séries temporais, históricas, cronológicas ou marchas Descrevem os valores da variável, em determinado local, discriminados segundo intervalos de tempo variáveis. Exemplo: Taxas de desemprego no Município de Porto Alegre 1995/2000 ANOS Taxas de Desemprego 1995 9,6 1996 11,7 1997 12,5 1998 14,4 1999 16,9 2000 15,4 Fonte; PED-RMPA – Convênio FEE, FGTAS/SINE-RS,SEADE-SP, DIEESE E PMPA Séries geográficas, espaciais, territoriais ou de localização Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: Taxas de desemprego na Região Metropolitana de Porto Alegre, no Município de Porto Alegre e demais Regiões Metropolitanas selecionadas – 2000 Regiões Taxas de Desemprego Belo Horizonte 17,8 Salvador 26,6 Recife 20,7 São Paulo 17,6 Porto Alegre 15,4 RMPA 16,6 Fonte; PED-RMPA – Convênio FEE, FGTAS/SINE-RS,SEADE-SP, DIEESE E PMPA Séries específicas ou categóricas Descrevem os valores da variável, em determinado tempo e local, discriminados segundo especificações ou categorias. Exemplo: PRINCIPAL PROBLEMA DO BRASIL EM %. AMOSTRA REALIZADA EM SETEMBRO DE 1998 COM 12079 PESSOAS EM296 CIDADES. 3 PROBLEMA % DESEMPREGO 53 SAÚDE 9 VIOLÊNCIA/SEGURANÇA/POLÍCIA 8 FOME/MISÉRIA 5 EDUCAÇÃO 4 CORRUPÇÃO 3 ECONOMIA 2 SALÁRIO 2 HABITAÇÃO 1 INFLAÇÃO 1 REFORMA AGRÁRIA/SEM TERRA 0 OUTRAS 6 NÃO SABE 6 Fonte: DATAFOLHA Séries mistas Descrevem os valores da variável, em relação a dois critérios (tabela cruzada). Exemplo1: PERFIL DA POPULAÇÃO BRASILEIRA EM % -1998- PESQUISA AMOSTRAL DATAFOLHA-BRASIL M AS C FE M ID AD E M ÉD IA AT É 1º G 2º G SU P PO S- G R AD R EN D A FA M R EN D A IN D SU D ES TE SU L N O R D ES TE N O R TE /C -O ES TE ELITE 53 47 37 0 25 67 8 3724 1601 63 16 11 9 BATALHADORES 59 41 40 65 35 0 0 3943 1539 61 15 13 11 REMEDIADOS 53 47 38 54 46 0 0 1692 624 55 16 18 11 DESLOCADOS 49 51 32 0 83 16 1 756 394 49 18 22 11 EXCLUIDOS 49 51 40 87 13 0 0 403 207 37 15 34 15 POBRES 55 45 39 91 9 0 0 752 377 56 20 13 11 DESPOSSUÍDOS 48 52 35 72 28 0 0 350 183 35 14 36 16 MISERÁVEIS 48 52 46 100 0 0 0 234 131 27 13 45 16 TOTAL 50 50 38 64 28 7 1 907 413 43 15 28 13 FONTE: DATAFOLHA (BASE 100,8 MILHÕESDE PESSOAS) DISTRIBUIÇÕES DE FREQÜÊNCIAS Os dados em distribuições de freqüências são uma maneira de apresentar informações grupadas. Neste caso a variável pode ser expressa por ponto ( um único valor ) ou por intervalo ( dentro de um intervalo de valores ). Ao se constituir uma distribuição de freqüências (DF) precisa-se descrever alguns componentes da mesma. Tabela Primitiva Supondo uma coleta amostral de dados relativos aos salários semanais de quarenta funcionários que compõem uma amostra de uma Empresa Z. Os valores de cada um dos salários estão listados a seguir: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z 166 160 161 150 162 160 165 167 164 160 162 161 168 163 156 173 160 155 164 168 155 152 163 160 155 155 169 151 170 164 154 161 156 172 153 157 156 158 158 161 4 A esse tipo de tabela, cujos elementos não foram numericamente organizados, denominamos tabela primitiva ou dados brutos. Rol O rol é uma lista em que os valores estão dispostos em uma determinada ordem, crescente ou decrescente. Veja a seguir: 150 154 155 157 160 161 162 164 166 169 151 155 156 158 160 161 162 164 167 170 152 155 156 158 160 161 163 164 168 172 153 155 156 160 160 161 163 165 168 173 Distribuição de Freqüência A freqüência é o número de repetições da observação no conjunto de observações. A distribuição de freqüência de uma série de observações é uma função que representa os pares de valores formados por cada observação e seu número de repetições. Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 170 |--- 174 3 Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL Elementos de uma Distribuição de Freqüência - Classe Classes de freqüência ou, simplesmente, classe são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, . . ., k (onde k é o número total de classes da distribuição). Exemplo: O intervalo 154 |--- 158 define a segunda classe (i = 2) A distribuição é formada por seis classes, podemos afirmar que i = 6. – Limites de Classe Determina-se limites de classes os extremos de cada classe. O menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da classe ( ls ). Exemplo: Na terceira classe do exemplo acima, temos: li3 = 158 e Ls3= 162 – Amplitude de um Intervalo de Classe ( h ) É a medida de intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior. Assim: lilsh −= Exemplo: Calcule o intervalo de classe do exemplo acima. 5 – Amplitude Total ( H ) É a diferença entre o valor máximo e o valor mínimo da amostra. LiLsH −= Exemplo: Calcule amplitude amostral do exemplo acima. – Ponto Médio de uma Classe ( Xi ) É o ponto que divide o intervalo de classe em duas partes iguais. 2 lsliXi += Exemplo: O ponto médio da segunda classe, em nosso exemplo, é 156. – Freqüência Simples ou Absoluta ( fi ) É o número de observações correspondentes a uma classe. A soma de todas freqüências é representada por: ∑= fiN ( população ) ∑= fin ( amostra ) Exemplo: Para a distribuição em estudo, temos: 40==∑fin – Número de Classes Pode-se utilizar a regra de STURGES, que fornece o número de classes em função do total de casos: )(log33,31 NnK += Onde: K é o número de classes; N ou n é o número total de observações. Para determinar a amplitude do intervalo de classe, temos: K Hh = Exemplo: a) Se o número de observações for 500: b) Se n = 50 Truman L. Kelley, sugere os seguintes números de classes, com base no número total de observações, para efeito de representação gráfica: n 5 10 25 50 100 200 500 1000 K 2 4 6 8 10 12 15 15 SIMBOLOGIA ENTRE OS VALORES DE CLASSE: 6 Inclui o valor da esquerda mas não o da direita. Inclui o valor da direita mas não o da esquerda. Não inclui nem o valor da direita, nem o da esquerda. Inclui tanto o valor da direita quanto o da esquerda. – Tipos de Freqüências – Freqüências Relativas simples (fri) São os valores da razão entre as freqüências simples e a freqüência total. n fifri = Exemplo: Calcule a freqüência relativa simples da terceira classe, em nosso exemplo: ( R. 27,5 % dos funcionários recebem salário de R$ 158 até menos de R$ 162. ) – Freqüência Acumulada ( Fi ) É o total das freqüências de todos os valores inferiores ao limite superior. do intervalo de uma dada classe. fiffFi +++= ...21 ou ∑= fiFi Exemplo: Calcule a freqüência acumulada correspondente à terceira classe, em nosso exemplo: ( R. 24 funcionários recebem salário de R$ 150 até menos de R$ 162. ) – Freqüência Acumulada Relativa ( Fri ) É a freqüência acumulada da classe, dividida pela freqüência total da distribuição. n FiFri = Exemplo: Para a terceira classe, qual é a freqüência acumulada relativa? ( R. 60 % dos funcionários recebem salário de R$ 150 até menos de R$ 162. ) EXERCÍCIO Complete a seguinte tabela e responda as seguintes perguntas: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências Xi fri % fri FI Fri 150 |--- 154 4 152 0,1 10 4 0,1 154 |--- 158 9 156 0,225 22,5 13 0,325 158 |--- 162 11 160 0,275 27,5 24 0,6 162 |--- 166 8 164 0,2 20 32 0,8 166 |--- 170 5 168 0,125 12,5 37 0,925 170 |--- 174 3 172 0,075 7,5 40 1 Total 40 1 100 FONTE: PESQUISA DO SETOR DE PESSOAL a) Quantos empregados tem salário entre R$ 154, inclusive, e R$ 158? ( R. 9 ) 7 b) Qual a percentagem de empregados cujas salários são inferiores a R$ 154? ( R.10% ) c) Quantos empregados tem salário abaixo de R$ 162? ( R. 24 ) d) Quantos empregados tem salário não inferior a R$ 158? ( R. 27 ) – Distribuição de Freqüência sem Intervalos de Classe Quando se trata de variáveis discreta de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe. Exemplo: Se X a variável é o número de filhos do sexo masculino de 34 famílias de quatro filhos pesquisadas, complete a tabela: i X fi fri Fi Fri 0 2 0,0588 2 0,0588 1 6 0,1765 8 0,2353 2 10 0,2941 18 0,5294 3 12 0,3529 30 0,8824 4 4 0,1176 34 1,0000 EXERCÍCIOS 1. Conhecidas as notas de 50 alunos: 84 68 33 52 47 73 68 61 73 77 74 71 81 91 65 55 57 35 85 88 59 80 41 50 53 55 76 85 73 60 67 41 78 56 94 35 45 55 64 74 65 94 66 48 39 69 89 98 42 54 Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo das classes. NOTAS 30 40 40 50 50 60 60 70 70 80 80 90 90 100 fi 4 6 10 10 9 7 4 2. Os resultados do lançamento de um dado 50 vezes foram os seguintes 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3 Forme uma distribuição de freqüência sem intervalos de classe. XI 1 2 3 4 5 6 fi 6 8 9 7 10 10 – Representação Gráfica O gráfico estatístico é uma forma de apresentação dos dados, onde o objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e visual do fenômeno em estudo. Veja alguns exemplos de gráficos: 8 1.POLIGONAL: Gráfico de linha ou poligonal. 2. GRÁFICO DE COLUNAS: Com os mesmos dados do exemplo anterior: 9 EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS 0 10.000 20.000 30.000 40.000 50.000 60.000 70.000 1990 1991 1992 1993 1994 1995 1996 1997 1998* ANOS U S$ IMPORTAÇÕES EXPORTAÇÕES 1990 1991 1992 1993 1994 1995 1996 1997 1998* 0 10.000 20.000 30.000 40.000 50.000 60.000 70.000 US $ ANOS EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS IMPORTAÇÕES EXPORTAÇÕES 3. GRÁFICO DE BARRAS: Com os mesmos dados anteriores. 4. GRÁFICO DE SETORES: 5. HISTOGRAMA: Um histograma é uma representação gráfica de uma série de dados grupados por meio de retângulos cujas áreas são proporcionais às freqüências absolutas simples de cada intervalo (classe). Exemplo: Número de salários mensais recebidos pelos funcionários da Empresa Beta - POA - 1999. 10 EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS EM 1997 61.358 52.086 IMPORTAÇÕES EXPORTAÇÕES EXPORTAÇÕES E IMPORTAÇÕES BRASILEIRAS EM 1997 20.661 21.041 20.544 25.256 33.079 49.583 53.301 61.358 27.970 0 10.000 20.000 30.000 40.000 50.000 60.000 70.000 1990 1991 1992 1993 1994 1995 1996 1997 1998* ANOS U S$ IMPORTAÇÕES 0 50 100 150 200 250 2 4 6 8 10 Os dados deste histograma foram obtidos a partir da seguinte tabela: SALÁRIOS MENSAIS Número de funcionários 0 2 20 2 4 100 4 6 200 6 8 150 810 30 Total 500 6. POLÍGONO DE FREQÜÊNCIAS: É a representação gráfica de uma série de dados grupados por meio de um polígono, considerados os pontos médios de classes e as respectivas freqüências absolutas dos mesmos. Com os dados do exemplo anterior: Número de salários 0 20 40 60 80 100 120 140 160 180 200 1 3 5 7 9 salários. 2.4. MEDIDAS DE TENDÊNCIA CENTRAL Na maior parte das vezes em que os dados estatísticos são analisados, procuramos obter um valor para representar um conjunto de dados. Este valor deve 11 sintetizar, da melhor maneira possível, o comportamento do conjunto do qual ele é originário. Nem sempre os dados estudados têm um bom comportamento, isto pode fazer com que um único valor bem represente ou não o grupo. As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destaca-se as seguintes: Média aritmética, Moda e Mediana. Cada uma com um significado diferenciado, porém tendo como serventia representar um conjunto de dados. A maneira de se obter estas medidas é um pouco diferenciada dependendo de como os dados são apresentados. Eles podem vir de forma isolada (não grupados) ou ainda ponderados (grupados em intervalos ou sem intervalo de classe, por ponto). 2.4.1. – Média Aritmética ( µ ou x ) É o quociente da divisão da soma dos valores da variável pelo número deles: N xi∑ =µ ou n xi X ∑= Sendo: µ ou x : média aritmética Xi : valores da variável n ou N : número de valores 2.4.1.1. – Dados não-agrupados Quando deseja-se conhecer a média dos dados não-agrupados, determinamos a média aritmética simples . Exemplo: Sabendo-se que as vendas diárias da empresa A, durante uma semana, foram de 10, 14, 13, 15, 16, 18 e 12 unidades, tem-se, para produção média da semana: (R. 14 unidades ) 2.4.1.2. – Propriedades da Média 1ª Propriedade A soma algébrica dos desvios em relação à média é nula. ∑ = 0di No exemplo anterior, temos: Desvio em relação à média É a diferença entre cada elemento do conjunto de valores e a média . xxidi −= ou µ−= xidi Para o exemplo dado, temos: d1 = 10 – 14 = -4 d5 = 16 – 14 = 2 d2 = 14-14 = 0 d6 = 18 – 14 = 4 d3 = 13 – 14= -1 d7 = 12 – 14 = -2 d4 = 15 – 14 = 1 2ª Propriedade Somando-se (ou subtraindo-se) uma constante (c ) a de todos os valores de uma variável a média do conjunto fica aumentada (ou diminuída) dessa constante. cxycxiyi ±=⇒±= Somando-se 2 a cada um dos valores da variável do exemplo dado, tem-se: y1 = 12 , y2 = 16 , y3 = 15 , y4 = 17 , y5 = 18 , y6 = 20 e y7 = 14 Calcule iy . 12 3ª Propriedade Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante ( c ), a média do conjunto fica multiplicada (ou dividida) por essa constante. cxycxiyi .. =⇒= ou c xy c xiyi =⇒= Multiplicando-se por 3 cada um dos valores da variável do exemplo dado, obtem-se: y1 =30 , y2 = 42 , y3 = 39 , y4 = 45 , y5 = 48 , y6 = 54 e y7 = 36 Calcule iy = 42 2.4.1.4 – Dados Agrupados 2.4.1.4.1 – Sem intervalos de classe As freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que leva a calcular a média aritmética ponderada . N fixi∑ = . µ ( população ) n fixi X ∑= . ( amostra ) Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, adotando-se a variável “número de filhos do sexo masculino”, determine a média. N.º de Meninos fi 0 2 1 6 2 10 3 12 4 4 Σ = 34 2.4.1.4.2. – Com intervalos de classe Convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada. N fixi∑ = . µ ( população ) n fixi X ∑= . ( amostra ) onde Xi é o ponto médio da classe. Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 13 170 |--- 174 3 Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL EXERCÍCIOS 1 – Calcule a média aritmética das seguintes distribuições amostrais: a) Classes 30 |--- 50 |--- 70 |--- 90 |--- 110 |--- 130 fi 2 8 12 10 5 b) Consumo (kwh) 5 |--- 25 |--- 45 |--- 65 |--- 85 |--- 105 |--- 125 |--- 145 |--- 165 N.º de Usuários 4 6 14 26 14 8 6 2 c) Custos (R$) 450 |--- 550 |--- 650 |--- 750 |--- 850 |--- 950 |--- 1050 |--- 1150 fi 8 10 11 16 13 5 1 Respostas: a) x = 84,3, x = 79,5 Kwh x = R$ 754,69 2.4.2. – Moda ( Mo ) A moda de uma distribuição é o valor da variável que tem a maior freqüência absoluta simples, quer dizer aquele valor que aparece mais [mais se repete]. Existem algumas situações nas quais não existe moda, isto é, todos os valores da variável só aparecem uma vez, não se repetem. Em outras situações pode-se ter mais de uma moda, isto é, quando doisou mais valores da variável têm maior freqüência [freqüências iguais], neste caso diz-se que o conjunto é bimodal. Pode-se ter três, quatro, etc. Nestes casos é difícil escolher a moda como um representante do grupo, uma vez que teremos muitos representantes. Para que se possa obter o valor da moda é necessário que os dados estejam no mínimo em escala nominal, quer dizer, com qualquer nível de mensuração podemos obter o valor da moda, uma vez que ela é oriunda apenas de uma contagem. Portanto, a moda é o valor que ocorre com maior freqüência em uma série de valores. Exemplo: - o dono do restaurante vai preparar mais o filé de maior saída; - maioria tirou “C” numa turma; - o proprietário da loja de sapato vai comprar mais os números de maior saída. 2.4.2.1 – Dados não-agrupados A moda é facilmente reconhecida: basta procurar o valor que mais se repete. Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 12, 12, 12, 13, 15 tem moda igual a 12 . • Amodal : são as séries nas quais nenhuma valor apareça mais vezes que outros. Exemplo: 3, 5, 8, 10, 13. • Multimodal : é uma série que possui dois ou mais valores modais. Exemplo: Xi = 2 3 4 4 4 5 6 7 7 7 Mo1 = 4 Mo2 = 7 2.4.2.2. – Dados agrupados 2.4.2.2.1 – Sem intervalos de classe É o valor da variável de maior freqüência. 14 Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos (ver página 14), indique a moda dessa distribuição. R: = 3 2.4.2.2.2 – Com intervalos de classe A classe que apresenta maior freqüência é denominada classe modal . O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta . Há, para o cálculo da moda, outros métodos mais elaborados, como, por exemplo, o que faz uso da fórmula de CZUBER : h DD DliMo . 21 1 + += na qual: li : Limite inferior de classe modal. h : Amplitude da classe modal. D1: fMo – f ant : freqüência simples da classe modal menos a freq. anterior. D2: fMo – f post : freqüência simples da classe modal menos a freq. posterior. Exemplo: Calcule a moda da seguinte distribuição pela fórmula de Czuber: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 170 |--- 174 3 Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL R: R$ 159,6 2.4.3. – Mediana ( Md ) É o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Para que se possa obter o valor da mediana os dados têm que estar em uma escala de medida no mínimo ordinal, uma vez que precisa-se ordená-los. A mediana é o valor que divide o conjunto ao meio, isto é, concentra antes e depois de si, 50% das observações ordenadas. Ao contrário da média aritmética a mediana não sofre influência quando temos no conjunto valores discrepantes [ tanto para mais como para menos ]. Neste caso a mediana pode melhor representar um conjunto do que a média aritmética, porém não tem o mesmo significado que aquela. A mediana pode ou não pertencer ao conjunto do qual ela é originária, vai pertencer sempre que o conjunto tiver um número ímpar de informações e vai ou não pertencer quando o conjunto tiver um número par de observações. Com isso já podemos ver que a quantidade de observações influi na maneira pela qual vamos encontrar o valor da mediana. 2.4.3.1. – Dados não-agrupados Estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será, quando n for: • impar : o termo de ordem 2 1+n ; 15 • par : a média aritmética dos termos de ordem 2 n e 1 2 + n . Exemplo 1: Dada a série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, identifique a mediana. Md = 10 Exemplo 2: Dada a série de valores: 2, 6, 7, 10, 12, 13, 18, 21, calcule a mediana. Md = 11 • O valor da mediana pode coincidir ou não com um elemento da série. 2.4.3.2. – Dados agrupados Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por: 2 n 2.4.3.2.1 – Sem intervalos de classe É o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino, determine a mediana: N.º de Meninos fi 0 2 1 6 2 10 3 12 4 4 Σ = 34 R: 2 meninos • No caso de existir uma freqüência acumulada (Fi), tal que: a mediana será dada por: 2 1++ = ii xxMd isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e a seguinte. Exemplo: Determine a mediana da distribuição abaixo: Xi fi Fi 12 1 14 2 15 1 16 2 17 1 20 1 R: Md = 15,5 2.4.3.2.2 – Com intervalos de classe Classe mediana é aquela correspondente à freqüência acumulada imediatamente superior a 2 ifΣ . Em seguida, emprega-se a fórmula: fMd hFantn liMdMd ). 2 ( − += onde: li Md = Limite inferior da classe da mediana. 16 fi Md = Freqüência simples da classe da mediana. h = amplitude da classe da mediana. Fant = Freqüência acumulada anterior a classe da mediana. Exemplo: Calcule a mediana da seguinte distribuição: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 170 |--- 174 3 Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL R: Md = R$ 160,54 No caso de existir uma freqüência acumulada exatamente igual a 2 ifΣ , a mediana será o limite superior da classe correspondente. Exemplo: i Classes fi Fi 0 |--- 10 1 10 |--- 20 3 20 |--- 30 9 30 |--- 40 7 40 |--- 50 4 50 |--- 60 2 26 EXERCÍCIOS 1 – Considerando os conjuntos de dados calcule a média, a mediana e a moda. a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 R: X = 5,1 Md = 5 mo = 5 b) 20, 9, 7, 2, 12, 7, 20, 15, 7 R: X = 11 Md = 9 mo = 7 c) 51,6; 48,7; 50,3; 49,5; 48,9 R: X = 49,8 Md = 49,5 amodal d) 15, 18, 20, 13, 10, 16, 14 R: X = 15,1 Md = 15 amodal 2.5. MEDIDAS DE DISPERSÃO 2.5.1. – Dispersão ou Variabilidade A média, ainda que considerada como um número que tem a faculdade de representar uma série de números não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Considerando os seguintes conjuntos de valores das variáveis X, Y e Z: X: 5, 5, 5, 5, 5. Y: 3, 4, 5, 6, 7. Z: 5, 0, 10, 8, 2. Calculando a média aritmética de cada um desses conjuntos, obtem-se: === ZYX 5 . Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno do valor da média, pode-se dizer que o conjunto Xi apresenta dispersão ou variabilidade nula e que o conjunto yi apresenta uma dispersão ou variabilidade menor que o conjunto zi. Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua média, é necessário recorre às medidas de dispersão. 17 Dessas medidas, estudaremos: a .variância absoluta, o desvio padrão e o coeficiente de variação ou de variabilidade . 2.5.2. – Variância ( σ² ou s² ) e Desvio Padrão( σou s ) A amplitude total e o desvio médio também são medidas de variação, no entanto a variância e o desvio padrão levam em consideração a totalidade dos valores da variável em estudo sem utilizar a idéia de módulo, o que faz delas índices de variabilidade bastante estáveis e os mais empregados. A variância baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Dados não agrupados Dados agrupados N xi∑ − = 2 2 )( µσ ou N fixi∑ − = 2 2 )( µσ ( população ) 1 )( 22 − − = ∑ n xxi s ou 1 )( 22 − − = ∑ n fixxi s ( amostra ) ou 2 2 2 µσ −= ∑ N xi 2 2 2 µσ −= ∑ N fixi ( população ) 1 22 2 − − = ∑ n xnxi s 1 22 2 − − = ∑ n xnfixi s ( amostra ) Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão, definida como a raiz quadrada da variância. 2σσ = ( população ) 2ss = ( amostra ) • Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. • A variância é uma medida que tem pouca utilidade na estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. Para o cálculo do desvio padrão, considera-se os seguintes casos: 2.5.2.1. – Dados não-agrupados 2 2 µσ −= ∑ N xi ( população ) ou 1 22 − − = ∑ n xnxi s ( amostra ) 18 Observe como exemplo, o conjunto de valores da variável populacional x: 40, 45, 48, 52, 54, 62, 70 O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: Xi xi2 R: σ = 9,49 Exemplo: Calcule o desvio padrão, dados os valores da população: 8, 10, 11, 15, 16, 18 R: σ = 3,56 2.5.2.2. – Dados Agrupados – Sem intervalo de classe Como, neste caso, temos a presença de freqüências, deve-se levá-las em consideração, resultando a fórmula: 2 2 µσ −= ∑ N fixi ( população ) ou 1 22 − − = ∑ n xnfixi s ( amostra ) Exemplo: Calcule o desvio padrão da seguinte distribuição amostral: Xi fi Xi fi X²i fi 0 2 0 0 1 6 6 6 2 12 24 48 3 7 21 63 4 3 12 48 30 63 165 R: s = 1,06 – Com intervalos de classe Exemplo: Calcule o desvio padrão da tabela abaixo. SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 170 |--- 174 3 Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL R: s = R$ 5,64 As fórmulas apresentadas abaixo, para o cálculo do desvio padrão, só não são o método usualmente mais prático, como também mais preciso. Quando a média não é exata e tem de ser arredondada, cada desvio fica afetado ligeiramente do erro, devido a esse arredondamento. O mesmo acontece com os quadrados, podendo os resultados do cálculo ser menos exatos. 19 Dados não agrupados Dados agrupados 2 2 µσ −= ∑ N xi ou 2 2 µσ −= ∑ N fixi ( população ) ou 1 22 − − = ∑ n xnxi s ou 1 22 − − = ∑ n xnfixi s ( amostra ) 2.5.2.3 - Propriedades 1º) Somando-se (ou subtraindo-se) uma constante ( c ) a (de) todos os valores de uma variável, o desvio padrão não se altera: xycxiyi σσ =⇒±= 2º) Multiplicando-se todos os valores de uma variável por uma constante (diferente de zero), o desvio padrão fica multiplicado por essa constante: cxycxiyi .. σσ =⇒= ou c xy c xiyi σσ =⇒= 3º) Em se tratando de uma distribuição normal, observa-se que entre os limites proporcionados por: a) µ ± σ, estão contidas cerca de 68% das informações; b) µ ± 2σ, estão contidas cerca de 95% das informações; c) µ ± 3σ, estão contidas cerca de 99% das informações. 2.5.3. – Coeficiente de Variação ( δ para população ou g para amostras ) É a caracterização da dispersão ou variabilidade dos dados em termos relativos a seu valor. µ σδ = ou x sg = Exemplo 1: Determine o coeficiente de variação da distribuição de freqüência da página anterior: R: g = 3,5% Exemplo 2: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos: x s Estaturas 175 cm 5,0 cm R: g1 = 2,86% < g2 = 2,94% Pesos 68 kg 2,0 kg EXERCÍCIOS 1 – Calcule os desvios padrões dos conjuntos de dados amostrais : a) 1, 3, 5, 9 R: s = 3,42 b) 20, 14, 15, 19, 21, 22, 20 R: s = 3,07 c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2 R: s = 3,30 d) -10, -6, 2, 3, 7, 9, 10 R: s = 7,60 2 – Calcule os desvios padrões das distribuições: a) Xi 2 3 4 5 6 7 8 R: s = 1,54 fi 1 3 5 8 5 4 2 3 – Dada a distribuição relativa a 100 lançamentos de 5 moedas simultaneamente: N.º de Caras 0 1 2 3 4 5 R: s = 1,13 20 Freqüências 4 14 34 29 16 3 Calcule o desvio padrão. – Calcule o desvio padrão da distribuição: Classe 2 |--- 6 6 |--- 10 10 |--- 14 14 |--- 18 18 |--- 22 fi 5 12 21 15 7 R: s = 4,48 5 – Em um exame final de Matemática, o grau médio de um grupo de 150 alunos foi 7,8 e o desvio padrão, 0,80. Em Estatística, entretanto, o grau médio final foi 7,3 e o desvio padrão, 0,76. Em que disciplina foi maior a dispersão? R: Estatística 6 – Medidas as estaturas de 107 indivíduos, obtivemos X = 162,2 cm e s = 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam maior variabilidade em estatura ou em peso? R: Estatura 7 – Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão de 5,97 cm. Outro grupo de 125 moças tem um estatura média de 161,9 cm, sendo o desvio padrão igual a 6,01 cm. Qual é o coeficiente de variação de cada um dos grupos? Qual o grupo mais homogêneo? 8 – Um grupo de cem estudantes tem uma estatura média de 163,8 cm, com um coeficiente de variação de 3,3 %. Qual o desvio padrão desse grupo? R: 3,72% e 3,71% ; o segundo 9 – Uma distribuição apresenta as seguintes estatísticas: s = 1,5 e g = 2,9 % . Determine a média da distribuição. R: 51,72 3. NÚMEROS ÍNDICES 3.1. RELATIVOS E ÍNDICES 3.1.1. Conceito e aplicações Números índices são medidas estatísticas usadas para mostrar as diferentes variações da variável, ou variáveis em relação ao tempo, a localização, rendimento ou outras características. Um conjunto de números índices com determinada característica chama-se de série de índices. Os números índices servem para comparar custos referentes à alimentação, custo de vida e produção de uma região, durante um período com os de outro período ou outra região. Normalmente são utilizados nos negócios e na economia, porém também têm sua utilidade na educação, saúde, segurança, etc. Com finalidade financeira e econômica, os índices fornecem parâmetros para as previsões e informações gerais freqüentemente utilizadas nos negócios. No Brasil encontram-se índicesde salários, de produção, de desemprego, custo de vida e outros. Os índices mais conhecidos são o ÍNDICE GERAL DOS PREÇOS (IGP), calculado pela Fundação Getúlio Vargas, e o ÍNDICE DE PREÇO AO CONSUMIDOR ( IPC), calculado pelo IBGE. Nos contratos de trabalho, torna-se comum o uso de cláusulas de indexação que prevêem aumentos automáticos de salários correspondentes ao acréscimo do custo de vida. Pode-se dizer que o número índice é um indicador de tendência central de um conjunto de variáveis, em duas ou mais situações, pretendendo refletir o comportamento de modo aproximado de determinadas variáveis. Normalmente a “cesta de produtos”, usualmente adotada para o cálculo do índice do custo de vida, inclui o custo da: - alimentação; - vestuário; - habitação; - educação; - transportes; - gastos gerais. 21 Há limitação no cálculo destes índices, e pode-se dizer que eles funcionam bem nos períodos de prosperidade e depressão moderadas, porém, falham durante uma forte depressão. 3.2. ÍNDICE DE UM BEM 3.2.1. Relativos de preço É um indicador que fornece a variação dos preços de uma mercadoria ou conjunto de mercadorias, entre dois tempos ou espaços distintos. É a relação entre o preço de uma única utilidade , em um período determinado, e o de outro período chamado básico de referência. Se os preços não se mantêm constantes em um período, pode-se obter uma média adequada para expressar esta variação. Seja: Po = preço da utilidade durante o período básico Pt = preço da utilidade durante o período considerado Preço relativo = Po Pt x 100 Representa-se por: Pt,n De maneira geral Pa e Pb são preços de uma utilidade durante os períodos a e b respectivamente. O preço relativo do período b, referido ao período a é definido por: Pb/Pa e notado por: Pa,b = Pa Pb Ex.: O preço médio de um litro de leite nos anos de 1999 e 2000 são respectivamente R$ 0,6 e R$ 0,8. Tomando-se 1999 como básico e 2000 como ano dado tem-se: Preço relativo = P1999, 2000 = 1999 2000 preco preco = 6,0 8,0 = 1,33 = 133% Significa que o preço do leite em 2000 foi de 133% do de 1999, ou seja aumentou 33%. 3.2.2. Relativo de quantidade É o indicador que fornece a variação nas quantidades de um produto ou de um conjunto de produtos, entre dois períodos de tempo ou pontos no espaço. Por exemplo, num índice de produção a expressão é a seguinte: o,t = qt qo x 100 3.3. OS ÍNDICES DE LASPEYRES E DE PAASCHE 3.3.1. ÍNDICES PONDERADOS Os índices simples apresentam algumas desvantagens, em especial, a inexistência de pesos diferentes para cada utilidade que os compõem, de acordo com sua importância relativa. A ponderação utilizada nos métodos a seguir baseia-se na participação de cada bem no valor transacionado total, mediante a fixação do peso na época básica ou peso variável na época atual. 3.3.2. Índice de Laspeyres (época básica) 22 Constitui uma média ponderada de relativos, sendo os fatores de ponderação determinados a partir de preços e de quantidades da época básica. 3.4.2.1. Índice de Preço ILPo, t ILPo,t = ∑ ∑ Pt qo Po qo i i i i . . 3.4..2.2. Índice de Quantidade (permuta-se P por q) ILQo,t = q t Po q o Po i i i . . 1 No Índice de Preço a diferença da importância gasta deve-se a variação nos preços, e no índice de quantidade a variação se deve a variação nas quantidades adquiridas, uma vez que os preços permanecem constantes. Exemplo: Com os dados da tabela abaixo e considerando o ano de 2000 como base, determine um índice de preço e de quantidade consumida, usando o método de Laspeyres . Artigos 2000 2001 2002 Preço médio Quantidade consumida Preço médio Quantidade consumida Preço médio Quantidade consumida açúcar arroz feijão 2 3 5 4 3 2 2 4 6 5 2 5 3 6 8 6 3 6 Índice de Laspeyres de preço ILPo,t = ∑ ∑ pt qo po qo i i i i . . ILP00,01 = ( ) ( ) ( ) ( ) ( ) ( ) ==++ ++ =∑ ∑ 27 32 253342 263442 80.00 80.01 xxx xxx qp qp ii ii 1,1852 ou 118,52% ILP00,02 = ( ) ( ) ( ) ( ) ( ) ( ) ==++ ++ =∑ ∑ 27 46 253342 283643 80.00 80.02 xxx xxx qp qp ii ii 1,7037 ou 170,37% Índice de Laspeyres de Quantidade ILQo,t = ∑ ∑ qt Po qo po i i i i . . ILQ00,01 = ( ) ( ) ( ) ( ) ( ) ( ) ==++ ++ =∑ ∑ 27 41 523324 553225 80.00 80.01 xxx xxx pq pq ii ii 1,5185 ou 151,85% ILQ00,02 = ( ) ( ) ( ) ( ) ( ) ( ) ==++ ++ =∑ ∑ 27 51 523324 563326 80.00 80.02 xxx xxx pq pq ii ii 1,8889 ou 188,89% 3.3..3. Índice de Paasche (época atual) Trata-se de uma média ponderada de relativos, sendo os pesos calculados com base nos preços e nas quantidades dos bens da época atual. A base portanto é a época atual. É a relação do dispêndio com o componente i na época atual com o total da mesma época. 3.3..3.1. Índice de Paasche de preço IPPo,t = ∑ ∑ Pt qt Po qt i i i i . . 23 O índice mede a relação entre o dispêndio monetário necessário para adquirir bens nas quantidades e sistemas de preços da época atual e o dispêndio dado pelas quantidades da época atual aos preços vigentes na época básica. 3.3..3.2. Índice de Paasche de Quantidade IPQo,t = ∑ ∑ qt pt qo pt i i i i 3.4. ÍNDICES DE BASE FIXA E MÓVEL 3.4.1. ÍNDICES DE BASE FIXA São séries de números índices construídas através da fixação de um período base. A fixação da base possui uma importância considerável já que alguns índices, geralmente, não satisfazem a propriedade circular, no caso do Índice de Laspeyres, por exemplo, ao fixar-se a base de comparação, fixa-se também a base de ponderação. 3.4.2. ÍNDICE DE BASE MÓVEL (ENCADEADA) A base, neste método, é alterada de período a período. O método consiste: a) construção de índices em elos IO,1,I1,2. I (t-l),t b) construção de um índice em cadeia, fixando-se determinado período como base, aplicando-se o critério circular. IO,1 = IO,1 IO,2 = IO,1.I1,2 IO,3 = IO,1 . I1,2. I2,3 3.5. TROCA DE BASE A mudança de base na prática, de uma série de número, para uma base mais recente, é feita dividindo-se cada índice da série original pelo número índice correspondente à nova época base. Sob o aspecto matemático este procedimento só é válido e aplicável quando os números índices satisfazem as propriedades circular (não é válido para os índices de Laspeyres, Paasche, pois apresentam pesos variáveis, onde a mudança no período exige a mudança dos pesos). Exemplo: A tabela a seguir apresenta a produção industrial no período de 1979 a 1990, sendo o ano de 1979 considerado a época base. Obter um novo índice adotando como básico o ano de 1983. 1) Anos Índice produção industrial (1979 = 100) Novo índice (1983 = 100) 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 100 104 97 112 120 124 134 125 139 143 143 134 83 87 81 93 100 103 112 104 116 119 119 112 Fonte: Dados Hipotéticos 24 2) Conjugação de duas ou mais séries. Ano Índice antigo (1980 = 100) Índice novo (1985=100) Mudança base índice antigo (1985 = 100) Índice conjugado (1985=100 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 100 90 108 160 196 200 100 120 160 210 240 250 50 45 54 80 98 100 50 45 54 80 98 100 120 160 210 240 250 Os índices, na mudança de base para 1985, foram divididos por 200 e multiplicados por 100 este resultado. A última coluna fornece a série completa. Se a série de 80 a 85 for construída com base na fórmula de Laspeyres, estaríamosadmitindo que as quantidades de 1985 e não de 1980 estariam agora figurando como pesos, uma vez que neste índice, os pesos (quantidades) mudam quando mudar a base. Pelo método de Laspeyres os I83,80 e I85,80 seriam assim expressos: P q P q 83 80 80 80 160. . = e P q P q 85 80 80 80 200. . = Mudando de base para 1985, pelo método abreviado para o ano de 1983, as expressões seriam: P q P q 83 80 85 80 160 200 . . = = 0,8 ou 80% P q P q P q P q 83 80 85 80 83 85 85 85 . . . . ≠ Os valores só coincidem quando as quantidades (pesos) de 1980 forem iguais a 1985. Esse exemplo mostra as limitações do método prático. 3.6. NÚMEROS ÍNDICES EM CADEIA São encadeamentos de números índices que satisfazem o teste circular. Seja P1, P2 e P3 os preços de um produto em 3 períodos. Então pode-se dizer: I (P3/P1) P P P P P P 3 1 3 2 2 1 = = I (P3/P2). I (P2/P1) O mesmo acontece com as quantidades. E isto é denominado de encadeamentos que satisfazem o teste circular. Os índices construídos por encadeamento somente coincidem com os de base fixa, quando a fórmula utilizada satisfizer a propriedade circular. 4. PROBABILIDADE 4.1. – Experimento Aleatório 25 São aqueles que não podem ser previamente determinados. Essa impossibilidade de prever-se os resultados, chamamos de acaso . Exemplo: Lançar um dado e anotar o número que ocorrerá na face voltada para cima. 4.2. – Espaço Amostral ( E ) É o conjunto formado por todos os resultados possíveis de um experimento aleatório. Exemplo 1: Ao se lançar um dado e observar a face superior, tem-se o espaço amostral: E = { 1,2,3,4,5,6 } Exemplo 2: Numa partida de futebol, uma das equipes pode obter resultados tais como: vitória (v), empate (e) ou derrota (d). Tem-se então: E = { v, e, d } 4.3. – Evento É um conjunto qualquer de resultados de um experimento aleatório. Pode-se dizer que um evento é um subconjunto do espaço amostral. Tipos de eventos: • Evento certo – é o próprio espaço amostral. Exemplo: Lançamento de um dado e ocorrência de um número menor ou igual a 6 na face superior. • Evento impossível – é o subconjunto vazio do espaço amostral. Exemplo: Lançamento de um dado e ocorrência de um número maior do que 6 na face superior. • Eventos elementares – são aqueles que têm um só elemento. Exemplo: Lançamento de um dado e ocorrência de um número ímpar maior do que 4 na face superior. EXERCÍCIOS 1 – No lançamento de uma moeda duas vezes consecutivas, determine o número de ocorrência de: R: E = { (C,C),(C,K),(K,C),(K,K) } a) duas coroas (c); R: 1 b) duas caras (k); R:1 c) exatamente uma cara; R: 2 d) exatamente uma coroa; R: 2 e) pelo menos uma cara; R: 3 f) pelo menos uma coroa; R: 3 g) no mínimo uma cara; R: 3 h) no máximo uma cara. R: 3 2 - No lançamento consecutivo de dois dados de cores diferentes, um vermelho e um branco, observando-se a face superior temos o seguinte espaço amostral: ( 1 , 1 ) ; ( 1 , 2 ) ; ( 1 , 3 ) ; ( 1 , 4 ) ; ( 1 , 5 ) ; ( 1 , 6 ) ( 2 , 1 ) ; ( 2 , 2 ) ; ( 2 , 3 ) ; ( 2 , 4 ) ; ( 2 , 5 ) ; ( 2 , 6 ) E = ( 3 , 1 ) ; ( 3 , 2 ) ; ( 3 , 3 ) ; ( 3 , 4 ) ; ( 3 , 5 ) ; ( 3 , 6 ) ( 4 , 1 ) ; ( 4 , 2 ) ; ( 4 , 3 ) ; ( 4 , 4 ) ; ( 4 , 5 ) ; ( 4 , 6 ) ( 5 , 1 ) ; ( 5 , 2 ) ; ( 5 , 3 ) ; ( 5 , 4 ) ; ( 5 , 5 ) ; ( 5 , 6 ) ( 6 , 1 ) ; ( 6 , 2 ) ; ( 6 , 3 ) ; ( 6 , 4 ) ; ( 6 , 5 ) ; ( 6 , 6 ) Com base no espaço amostral acima, determine a ocorrência de números: 26 a) iguais nos dois dados; R: 6 b) cuja soma seja 12; R: 1 c) cuja soma seja menor ou igual a 12; R: 36 d) cuja soma seja igual a 9; R: 4 e) cuja soma seja menor que 10; R: 30 f) cuja soma seja 7; R: 6 g) iguais ou com soma igual a 8; R: 10 h) múltiplos de 3 nos dois dados. R: 4 4.1. O CÁLCULO DA PROBABILIDADE Chamamos de probabilidade de um evento A ( )EA ⊂ o número real P(A), tal que: )( )()( En AnAP = onde: n(A) é o número de elementos de A; n(E) é o número de elementos de E. Exemplo 1: Considerando o lançamento de uma moeda e o evento A “obter cara”. R: E = { k, c } n ( E ) = 2 A = { k } n ( A ) = 1 2 1 )( )()( == En AnAP Exemplo 2: Considerando o lançamento de um dado, vamos calcular a probabilidade do: R: E = { 1,2,3,4,5,6 } a) evento A “obter um número par na face superior”. R: 1/2 b) evento B “obter um número menor ou igual a 6 na face superior”. R: 6/6 c) evento C “obter um número 4 na face superior”. R: 1/6 d) evento D “obter um número maior que 6 na face superior”. R: 0/6 Pelos exemplos que acabamos de ver, podemos concluir que: • Probabilidade do evento certo é igual a 1. • Probabilidade do evento impossível é igual a 0. • Probalidade de um evento A qualquer ( )EA ⊂ um número real P(A), tal que: 0 ≤ P( A ) ≤ 1 Exemplo 3: Qual a probabilidade de sair o ás de ouro quando retiramos uma carta de um baralho de 52 cartas? R:1/52 Exemplo 4: Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas? R:1/13 Exemplo 5: Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule a probabilidade de essa peça ser defeituosa. R:1/3 Exemplo 6: No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. R:1/9 Eventos Complementares ( P (A ) ) 27 A probabilidade de não ocorrer o evento A é igual a 1 menos a probabilidade de ocorrer A, que pode ser representada por: P (A ) = 1 – P(A) Exemplo: A tabela a seguir, apresenta o número de bombas injetoras existentes em uma fábrica, conforme as suas características. Todas estão em caixas iguais. Escolhendo uma caixa ao acaso, determine a probabilidade dela: Bombas Elétricas Manuais Novas 45 30 Usadas 15 10 a) conter uma bomba nova; R:3/4 b) conter uma bomba manual; R:2/5 c) não conter uma bomba elétrica nova; R:11/20 d) não conter uma bomba manual usada. R:9/10 3.2. AXIOMAS E TEOREMAS A probabilidade de ocorrer um evento A é representado por p(A) que satisfaz os seguintes axiomas. 1) P (A) ≥ 0 2) P (s) = 1 3) P (φ) = 0 ( A probalidade de um conjunto vazio é zero.) 4) P (AUB) = P (A) + P (B) ( teorema da soma para eventos mutuamente exclusivos) EVENTOS MUTUAMENTE EXCLUSIVOS (DISJUNTOS): Dois ou mais eventos são mutuamente exclusivos quando a ocorrência de um impede a ocorrência do outro. Diferentemente dos eventos complementares onde não necessariamente a união de dois eventos mutuamente exclusivos vai constituir o espaço amostral. Por isso todos os eventos complementares são mutuamente exclusivos, mas a recíproca não é verdadeira. Por exemplo, se lançarmos um dado e considerarmos os seguintes eventos: o primeiro estabelece o resultado como um número maior que dois { 3, 4 , 5 , 6} e o segundo um resultado menor que dois { 1 }. Nesse caso um número não pode ser maior e menor que dois ao mesmo tempo e a união dos dois conjuntos não forma o espaço amostral, pois o 2 está de fora. Sendo A e B evento mutuante excludentes, isto é não podem ocorrer ao mesmo por A ∩ B = φ 5) Se A1, A2.... An são dois eventos mutuante excludentes. ∞ P ( A1 U A2 U A3 U.... U An U...) = Σ P (Ai) i=1 6) P (AUB) = P (A) + P (B) – P (A ∩ B ) ( regra geral ou para eventos não exclusivos) EVENTOS NÃO EXCLUSIVOS: Dois ou mais eventos são não mutuamente exclusivos quando é possível ambos ocorrerem simultaneamente. Necessariamente os dois eventos não necessitam ocorrer juntos. 28 A B 4.3. PROBABILIDADE CONDICIONAL E INDEPENDÊNCIADE EVENTOS REGRAS DE MULTIPLICAÇÃO: As regras de multiplicação se relacionam com a determinação da probabilidade da ocorrência conjunta de A e B, isto é a interseção de A e B. P (A e B) = P (A ∩ B ) = P (A) . P (B) (para eventos independentes) P (A e B) = P (A ∩ B ) = P (A) . P (B / A) (para eventos dependentes) EVENTOS INDEPENDENTES: Diz-se que dois ou mais eventos são independentes, quando eles não exercem ações recíprocas, comportando-se cada um de maneira que lhe é própria, sem influenciar os demais. Isto é, a ocorrência de um não influencia de maneira alguma a ocorrência do outro. Lançando-se uma moeda o fato de sair cara no primeiro lançamento em nada influencia a probabilidade de sair uma nova cara, ou não, em um segundo lançamento, porém, em um sorteio como o da loto, o fato de um número ter saído no primeiro sorteio já altera as probabilidades dos outros números saírem nos próximos sorteios. EVENTOS DEPENDENTES: Dois ou mais eventos são dependentes, quando eles exercem ações recíprocas, ou seja a ocorrência de um influencia de alguma maneira a ocorrência do outro. O diagrama de árvore é particularmente útil como método para descrever os possíveis eventos conjuntos associados com as observações ou as tentativas seqüenciais. Exemplo: A probabilidade de duas pessoas A e B resolverem um problema são 1/3 e 2/5, respectivamente. Sabendo que a resolução do problema é independente para A e B, calcule a probabilidade de que: (a) nenhum resolva o problema (b) pelo menos um resolva o problema (c) A resolva o problema, mas B não (d) B resolva o problema, mas A não. Pessoa A pessoa B evento conjunto probabilidade do evento conjunto Br Ar e Br 1/3 . 2/5 Ar Ar e Br 1/3 . 3/5 Br Ar Br Ar e Br 2/3 . 2/5 Br Ar e Br 2/3 . 3/5 4.5. DISTRIBUIÇÃO DE PROBABILIDADE 4.5.1. Variáveis Aleatórias É uma função com valores numéricos, cujo valor é determinado por fatores de chance . As variáveis aleatórias são discretas ou contínuas . Uma variável aleatória é considerada discreta quando os valores podem ser contados . Exemplo: - Número de acidentes numa semana; - Número de defeitos de sapatos; 29 A B - Número de terremotos; - Número de livros numa estante; etc. 4.5.2. Valor Esperado ou Esperança Matemática ( E (x) ) Se uma variável aleatória x com os valores x1, x2,...xn, associado as probabilidades correspondentes p(x1), p(x2),...p(xn) então o seu valor esperado é: E(x) = x1 p(x1 ) + x2 p(x2) + .... +xn p(xn) O valor esperado de um experimento é uma média, e pode ser calculado como: E(x) = Σ Xi p(Xi) Exemplo 1: Se jogamos um dado equilibrado, qual o valor esperado numa jogada? R.: 3,5 Exemplo 2: Um investidor julga que tem 0,40 de probabilidade de ganhar R$ 25 000,00 e 0,60 de probabilidade de perder R$ 15 000,00 num investimento. Seu ganho esperado é: R.: R$ 1000 4.5.3. Desvio padrão ( σ (x) ) O desvio padrão é calculado com a fórmula: [ ]∑ −= 22 )()()( xExipxixσ Exemplo 3: Um empreiteiro faz as seguintes estimativas: Prazo de execução Probabilidade Xi P(Xi) Xi² P(Xi) 10 dias 0,20 2 2 15 dias 0,30 4,5 4,5 22 dias 0,50 11 11 17,5 17,5 O prazo esperado para execução da obra, de acordo com essas estimativas, é: R.: 17,5 DIAS. O desvio padrão é: 25,3065,329)( −=xσ = 4,82 EXERCÍCIOS 1 – Dez por cento dos carros num parque de carros usados têm bateria defeituosa. Se há 82 carros no lote, qual o número esperado de carros com bateria defeituosa? R.: 8,2 2 – O número de chamadas telefônicas recebidas por uma mesa e suas respectivas probabilidades para um intervalo de 3 minutos são: Número de chamadas 0 1 2 3 4 5 Freqüência relativa 0,60 0,20 0,10 0,04 0,03 0,03 Em média, quantas chamadas podem ser esperadas num intervalo de 3 minutos? R.: 0,79 3 – O Departamento Nacional de Saúde relata que aproximadamente 15% dos adultos do país serão atingidos por determinada espécie de gripe nos próximos 12 meses. Para uma cidade de 250 000 adultos, quantos podemos esperar serem afetados? 30 R.: 37500 4.6. – Distribuição de Probabilidade Consideremos a distribuição de freqüências relativa ao número de acidentes diários em um estacionamento: Número de Acidentes Freqüências Probabilidades 0 22 0,73 1 5 0,17 2 2 0,07 3 1 0,03 30=∑ Em um dia, a probabilidade de: a) não ocorrer acidente é: R.: 0,73 b) ocorrer um acidente é: R.: 0,17 c) ocorrerem dois acidentes é: R.: 0,07 d) ocorrerem três acidentes é: R.: 0,03 Pode-se, então, escrever: Número de Acidentes (Xi) Probabilidades P(Xi) 0 0,73 1 0,17 2 0,07 3 0,03 Σ 1 Essa tabela é denominada DISTRIBUIÇÃO DE PROBABILIDADE . Seja X uma variável aleatória que pode assumir os valores x1, x2,...xn. A cada Xi correspondem pontos do espaço amostral. Associando, então, a cada valor Xi a probabilidade pi de ocorrência de tais pontos no espaço amostral tem-se um distribuição de probabilidade. Onde, Σ pi = 1 Exemplo 1: Considerando o espaço amostral relativo ao “lançamento simultâneo de duas moedas” e se X representa “o número de caras” que aparecem, a cada ponto amostral, construa uma distribuição de probabilidade. Número de caras (XI) P( XI ) 0 0,25 1 0,5 2 0,25 Σ 1 4.7. Distribuição Binomial Requisitos: 1) Um experimento repetido n vezes independentes. 2) A probabilidade de ocorrer um evento A é representado por p e é dita prob. de sucesso. O valor de p é calculado para um experimento isolado. 3) A probabilidade de não ocorrer A é dita, prob. de insucesso e é representado por q, sendo p + q = 1 31 4) Seja X a variável aleatória discreta (vad) que assume os valores 0, 1, 2, ....n e representa o número de sucessos em n repetições do experimento. Satisfeitas estas condições a P (X = x) = f (x) = xnxqp xnx nxp − − = )!(! !)( x = nº de sucessos n = nº de experimento p = probabilidade de sucesso com 1 experimento. Ex: 1) A probabilidade de ganhar em um certo jogo é 40% em 1 rodada, se uma pessoa vai jogar 5 rodadas, qual a probabilidade de ganhar: a) uma rodada: P = 0,40 q = 0,60 p + q = 1 x = 1 n = 5 P(X=1)=5x 0,4x 0,1296 = 0,2592 x x (n-x) P ((X = x) = f (1) = C . p . q n b) mais de 4 rodadas X = 4 5 5 0 P (x>4) = (x=5) f (x) = C . 0,4 . 0,6 = 1 x 0,01024 = 0,01014 5 c) no máximo 1 rodada X = 0 f (0) + f (1) = f (0) + f (1) 0,2592 + 0,0776 = 0,3868 0 0 5 C . 0,4 . 0,6 = 0,0776 5 d) no mínimo 2 rodadas f (2) U f (3) U f (4) U f (5) ou 1 - (f (0) + f (1)) = 0,6632 2. Um time de futebol tem prob. constante de vencer um jogo num torneio equivalente a 30% qual a probabilidade de vencer a maioria das partidas em um torneio constituído por 5 jogos. P (X ≥ 3) = P (x = 3) + P (x = 4) + P (x = 5) n = 5 p = 0,30 q = 0,70 3. Uma companhia que vende equipamentos eletrônicos verifica que de todas as máquinas por ela instaladas, 40% exigem novos ajustamentos após a instalação. 32 a) Em 4 equipamentos instalados, qual a probabilidadede pelo menos 1 equipamento necessitar ajustamento. a) P = 0,40 q = 0,60 n = 4 p (x ≥ 1 ) = 1 - p (x = 0) 0 0 4 - 0 p (x = 0) = C p q 4 p (x ≥1) = 1 - 0,1292 = 0,8704 4.,7. DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE 4.7.1. A DISTRIBUIÇÃO NORMAL Entre as distribuições teóricas de variável aleatória contínuas, uma das mais empregadas é a DISTRIBUIÇÃO NORMAL . O aspecto gráfico de uma distribuição normal é o da figura abaixo: Principais características: 1ª) A variável aleatória X pode assumir todo e qualquer valor real . 2ª) A representação gráfica da distribuição normal é uma curva em forma de sino, simétrica em torno da média, que recebe o nome de curva normal ou GAUSS . 3ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real. 4ª) A curva normal é ASSINTÓTICA em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo. 5ª) Como a curva é SIMÉTRICA em torno da média, a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5 . Escreve-se: P (X > µ ) = P (X < µ ) = 0,5 . Quando existe uma variável aleatória com distribuição normal, o principal interesse é obter a probabilidade dessa variável aleatória assumir um valor em um determinado intervalo. Para calcular essa probabilidade é usada a distribuição normal padrão. A DISTRIBUIÇÃO NORMAL REDUZIDA (PADRÃO) (Z) tem distribuição normal de média 0 e desvio padrão 1. X ∼ N (µ = 0; σ = 1) σ µ− = XZ A tabela de distribuição normal reduzida, em anexo, apresenta a probabilidade de Z assumir qualquer valor entre a média 0 e um dado valor Z, isto é: P(0<Z<Z) 33 Exemplo 1: Em um exame final de Matemática, a média foi 72 e o desvio padrão 15. Determinar a variável reduzida (isto é, os graus expressos em unidades de desvio padrão) dos estudantes que obtiveram graus: a) 60; R.: -0,8 b) 93; R.: 1,4 c) 72. R.: 0 Exemplo 2: Com referência ao exemplo 1, determinar os graus correspondentes aos escores reduzidos: a) –1 ; R.: 57 b) 1,6. R.: 96 Exemplo 3: Dois estudantes foram informados de que alcançaram as variáveis reduzidas de 0,8 e –0,4, respectivamente, em um exame de múltipla escolha de inglês. Se seus graus foram 88 e 64, respectivamente, determinar a média e o desvio padrão dos graus do exame. R.: 72 e 20 Exemplo 4: Determinar a área limitada pela curva normal em cada um dos casos abaixo: a) Entre z = 0 e z = 1,2 R.: 0,3849 b) Entre z = -0,68 e z = 0 R.: 0,2518 c) Entre z = -0,46 e z = 2,21 R.: 0,6636 d) Entre z = 0,81 e z = 1,94 R.: 0,1828 e) À esquerda de z = - 0,6 R.: 0,2742 f) À direita de z = -1,28 R.: 0,8997 g) À direita de z = 2,05 e à esquerda de z = -1,44 R.: 0,0951 EXERCÍCIOS 1 – Determinar a média e o desvio padrão de um exame, cujos graus 70 e 88 correspondem, respectivamente, os escores reduzidos –0,6 e 1,4. R.: 75,4 e 9 2 – Determinar a área subtendida pela curva normal: a) cc R.: 0,2991 b) À esquerda de z = -1,78 R.: 0,0375 c) À esquerda de z = 0,56 R.: 0,7123 d) À direita de z = -1,45 R.: 0,9265 e) Correspondente a z ≥ 2,16 R.: 0,0154 f) Corresponde a -0,80 ≤ z ≤ 1,53 R.: 0,7252 g) À esquerda de z = -2,52 e à direita de z = 1,83 R.: 0,0395 h) Corresponde a z ≥ -1,64 R.: 0,9495 i) Corresponde a -1,96 ≤ z ≤ 1,96 R.: 0,9500 Exemplo 5: Determinar o valor, ou valores, de z em cada um dos casos, nos quais as áreas referem-se às limitadas pela curva normal: a) A área entre 0 e z é 0,3770. b) A área à esquerda de z é 0,8621. c) A área entre –1,5 e z é 0,0217. Exemplo 6: O peso médio de 500 estudantes do sexo masculino, de uma determinada universidade, é 75,5 kg e o desvio padrão é 7,5 kg. Admitindo-se que os pesos estão distribuídos normalmente, determinar quantos estudantes pesam: a) entre 60 e 77,5 kg; R.: 294 estudantes b) mais do que 92,5 kg. R.: 6 estudantes Exemplo 7: Determinar quantos estudantes do exemplo 6 pesam: a) menos do que 64 kg; R.: 32 estudantes b) 64 kg; R.: 0 estudantes Exemplo 8: A média dos diâmetros internos de uma amostra de 200 arruelas produzidas por uma certa máquina é 0,502 polegadas e o desvio padrão é 0,005 polegadas. A finalidade para a qual 34 essas arruelas são fabricadas permite a tolerância máxima, para o diâmetro, de 0,496 a 0,508 polegadas; se isso não se verificar, as arruelas serão consideradas defeituosas. Determinar a percentagem de arruelas defeituosas produzidas pela máquina, admitindo-se que os diâmetros são distribuídos normalmente. R.: 0,2302 5. AMOSTRAGEM 5.1. CENSO X AMOSTRA População: Qualquer conjunto que possui, pelo menos, uma característica em comum. Exemplo: Produção de peças da Indústria X. A população pode ser finita ou infinita. População finita: É aquela em que é possível enumerar todos os seus elementos. População infinita: É aquela em que não é possível enumerar todos os seus elementos. Uma população finita pode ser transformada, mediante processos operacionais, em infinita. Ex.: Retirar as fichas de uma urna e, depois de cada extração, repô-las. Pesquisa estatística: Pode ser feita através de dois processos: censo e amostragem. CENSO: Quando é investigada todas (sem exceção) as unidades de uma população. AMOSTRA: Uma amostra é qualquer subconjunto não vazio de uma população. Pode ser uma amostra com caráter científico: probabilística ou sem caráter científico: não probabilística. AMOSTRAGEM: É o processo através do qual é selecionada uma amostra de uma população. Nesta etapa define-se quais unidades populacionais que irão fazer parte da amostra. As razões pelas quais opta-se por realizar uma pesquisa amostral ao invés de um censo são: Economia de tempo; Economia de custos; Economia de trabalho; Quando a população for infinita ou muito grande; Quando a investigação for destrutiva. Apesar do processo amostral apresentar estas vantagens sobre o processo censitário ele acaba perdendo em precisão, pois é estudado apenas um subconjunto da população. Nesse caso todo resultado de amostra está sujeito a um erro amostral, o que não ocorre no censo, porém este custa mais caro, leva mais tempo e dá mais trabalho, principalmente quando a população é muito grande. 5.2. AMOSTRAGEM PROBABILÍSTICA E SUBJETIVA O método de amostragem, como foi dito, é classificado em: PROBABILÍSTICO: Quando todos os elementos da população têm probabilidade conhecida, e diferente de zero, de ser incluídos na amostra. Nesse caso este tipo de amostragem é o que dá a melhor garantia de representatividade da amostra em relação a população. NÃO-PROBABILÍSTICO: Quando a seleção é subjetiva, ou seja, a escolha dos elementos da amostra é feita de forma não-aleatória, justificadamente ou não. A chance que cada elemento tem de ser selecionado na amostra é desconhecida. Decorre disso que as probabilidades de serem identificadas características semelhantes da amostra e da população são pequenas ou inconsistentes. 35 nN nNx σσ . 1− − = − 1− − N nN 5.3. O MÉTODO DE AMOSTRAGEM ALEATÓRIA SIMPLES 1. Conceitos Básicos: Um processo de amostragem pode ser desenvolvido de duas maneiras distintas, são elas: AMOSTRAGEM COM REPOSIÇÃO: Uma amostra é dita com reposição quando as unidades amostrais são devolvidasà população, após cada extração. AMOSTRAGEM SEM REPOSIÇÃO: Quando a unidade amostral que é investigada não volta novamente para a população. Nesse caso utilizamos este tipo de amostragem para pequenas amostras. A diferença básica entre um tipo e outro de amostragem é a possibilidade de um elemento ser ou não considerado mais de uma vez na amostra que está sendo produzida. Processo de amostragem aleatória simples: (AAS) É aquele em que a amostra é dita aleatória simples. Definição: Uma amostra aleatória simples ( A A S ) é aquela em que cada elemento da população tem mesma chance de pertencer a amostra. Para o processo de AAS é necessário: 1º) ter um cadastro; 2º) a variância da população deve ser pequena; 3º) cada elemento deve ter igual probabilidade de seleção. Tipos de amostragem aleatória simples: a) A A S com reposição; b) A A S sem reposição. Número de A A S que se obtêm de uma população: a) Finita - Adotando o processo A A S com reposição. K = Nn onde N é o tamanho da população, n é o tamanho da amostra. - Processo de A A S sem reposição )!(! ! nNn NcK nN − == b) Infinita: Não se conhece o número de elementos da população. Teremos infinitas amostras 5.4.Distribuição Amostral de Médias Se a partir de uma certa população, calcula-se a média de todas as amostras possíveis de mesmo tamanho n, teremos uma distribuição amostral de médias. Propriedades de uma distribuição amostral de médias: 1º Propriedade: A expectância de X é a média da população. E (X) = µ 2º Propriedade: O desvio padrão da distribuição amostral de medias de uma população infinita é da pela expressão. 3ºPropriedade: O desvio padrão da distribuição de media considerando uma população finita é dado pela expressão. onde , é dito fator de correção para populações finitas. Exercícios sobre amostragem: 1.Uma população consiste de 5 números: 1, 3, 5, 7 e 9. 36 n x σσ = _ 10 2 54 )!25(!2 !53 5 == − = xC 5)( == µXE a) Determine os parâmetros média e variância absoluta. b) Determine o número de amostras possíveis de tamanho 2, que podemos obter da população em questão, adotando-se o esquema de AAS, sem reposição. c) Considerando a variável x, baseado em todas as amostras possíveis sem reposição, determine a média e o desvio padrão da distribuição amostral de x. a) 8=σ = 2,83 b) ∑= xPxXE )( Adotando-se o processo de A A S sem reposição com amostras de tamanho 2, tem-se: 1, 3 1, 5 1, 7 1, 9 3, 5 3, 7 3, 9 5, 7 5, 9 7, 9 amostras Médias amostrais P(x) x i . P(x) x² i . P(x) 1;3 2,0 0,10 0,20 0,40 1;5 3,0 0,10 0,30 0,90 1;7 4,0 0,10 0,40 1,60 1;9 5,0 0,10 0,50 2,50 3;5 4,0 0,10 0,40 1,60 3;7 5,0 0,10 0,50 2,50 3;9 6,0 0,10 0,60 3,60 5;7 6,0 0,10 0,60 3,60 5;9 7,0 0,10 0,70 4,90 7;9 8,0 0,10 0,80 6,40 Σ 1 5,00 28,00 c) 73,12528))(()()( 2 2 =−=Ε−Σ= XXPXXσ 2. Uma variável apresenta média 56 e variância 6,7. Considerando todas as amostras possíveis de tamanho 100 que podem ser selecionadas dessa população, utilizando o processo de AAS sem reposição, determine. a) A média da distribuição amostral de médias. b) A variância absoluta da distribuição amostral de médias. c) O desvio padrão da distribuição amostral de médias. µ = 56 σ²= 6,7 n = 100 37 5 5 25 === ∑ N x µ 85 5 )81492591( 22 2 2 =− ++++ =−= ∑ µσ N x nN nNx σσ . 1 _ − − = 73,1)2(866,0 2 8. 15 25_ == − − =xσ 56)( _ == µxE )1,0(~_ N x XZ σ µ− = 5,2 4 4004102 =−=Z a) b) c) 4º) Propriedade Seja X uma variável aleatória normalmente distribuída com média µ e desvio padrão σ. A variável aleatória x obtida de todas as amostras possíveis de tamanho n, terá distribuição normal com média E (X) = µ e desvio padrão σx. Portanto podemos associar a V.A. X uma V.A. padronizada: 3. Sabendo-se que o peso, dado em gramas, de determinado produto, produzido por uma fábrica está normalmente distribuído com média 400 e desvio padrão 40g, determinar. a) A probabilidade da média de 1 amostra de tamanho 100, pertencer ao intervalo [390;410]. b) A probabilidade da média de 1 amostra de tamanho 25, pertencer ao intervalo [390;410]. c) A probabilidade da média de 1 amostra constituída por 400 artigos pertencer ao intervalo [390;410]. µ = 400; σ = 40 a) P (390 ≤ x ≤ 410) = P (Z1 ≤ Z ≤ Z2) n = 100 -2,5 2,5 0,9938 - 0,0062 = 0,9876 b) n = 25 _ P (390 ≤ x ≤ 410) = 0,78871 38 067,0 100 7,6222 === = nn x σσσ 067,0258,0 7,6 === − n xσ 4 10 4040 ===→= − n xg σσσ 5,2 4 4003901 −=−=Z 8 5 40_ === n x σσ 25,1 8 4003901 −=−=Z ( ) n p pipiσ −= 1 -1,25 1,25 _ c)P (390 ≤ x ≤ 410) -5 5 d) Quanto maior a amostra mais chance existe para acertar o valor do parâmetro. 5.5. Distribuição amostral da proporção Parâmetro proporção pi da população Estatística proporção P da amostra P P P p p E (p) = pi P P P 5.5.1. Propriedades: 1ªPropriedade: E (p) = pi : a expectativa ou média da distribuição amostral de proporção corresponde ao parâmetro populacional proporção. 2ªPropriedade: O desvio padrão da distribuição amostral de proporções para populações infinitas é dado pela fórmula. 3ª Propriedade: O desvio padrão da distribuição amostral de proporções para populações finitas é: 39 25,1 8 4003902 =−=Z 2 400 402 === n x σσ 5 2 4003901 −=−=Z 5 2 4004102 =−=Z 05,0 64 2,08,0)1)(( == − = x n p pipiσ 04,0 100 2,08,0 == xpσ 0342,0 212 46,054,0 == xpσ 4ª Propriedade: A estatística proporção amostral P, que associa a variável padronizada Z é: Exercício: 1. Sabendo que 80% das unidades produzidas por determinada fábrica são classificadas como artigo de exportação. Considerando a extração de uma amostra aleatória de 64 unidades, determine a probabilidade que a proporção de unidades classificadas como artigos de exportação assumir um valor abaixo de 76%. a) Considere o mesmo enunciado para uma amostra de 100 unidade. pi = 0,8 n= 64 P ( P ≤ -,76) = P (Z ≤ - 0,8) = 0,2119 = 21,19% a) P (P ≤ 0,76) = P (Z ≤ -1,0) = 0,1587 15,87% 2. Numa eleição determinado candidato recebeu 46% dos votos. Determine a probabilidade de que um escrutínio efetuado em 212 votantes se obtenha a maioria em favor do candidato. 40 ( ) nN nNp pipiσ − − − = 1. 1 )1,0(~ N p PZ σ pi− = 8,0 05,0 8,076,0 −= − =Z 0,1 04,0 8,076,0 −= − =Z pi = 0,46 n = 212 1- pi = 0,54 E (p) = 0,46 → σp = 0,0342 P (p ≥ 0,5) = P (Z > 1,17) = 0,121 → 12,1% 6. ESTIMAÇÃO É o processo com a finalidade
Compartilhar