Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA APLICADA Notas de Aula Professor João Mattos Rio de Janeiro - 2o Sem/2015 Índice 1 - Introdução ...................................................................................................................................... 2 2 - Organização dos Valores da Variável Aleatória Através de Tabelas ......................................... 3 2.1 - Tabela Primitiva (Dados Brutos) e Rol..................................................................................... 3 2.2 - Distribuição de Freqüências .................................................................................................... 4 2.3 - Tipos de Freqüência Utilizadas nas Tabelas Distribuídas em Classe................................... 5 2.3.1 - Freqüência Simples ou Absoluta (fi ou Fi) e Freqüência Relativa (fri ou FRi) .................... 5 2.3.2 - Freqüência Acumulada Crescente (FAC) .............................................................................. 5 2.3.3 - Freqüência Acumulada Decrescente (FAD) .......................................................................... 6 2.3.4 - Histograma .............................................................................................................................. 6 3 - Medidas de Tendência Central para Conjuntos Não-Agrupados em Freqüências ................... 7 3.1 - Média Aritmética Simples ......................................................................................................... 7 3.2 - Média Aritmética Ponderada .................................................................................................... 7 3.3 - Moda........................................................................................................................................... 8 3.4 - Mediana...................................................................................................................................... 8 4 - Medidas de Dispersão ou de Variabilidade.................................................................................. 9 4.1 - Amplitude Total – (AT) .............................................................................................................. 9 4.2 - Desvio Médio ou Média dos Desvios – (DM) ........................................................................... 9 4.3 - Desvio Padrão - (DP, s ou �) .................................................................................................. 10 4.4 - Coeficiente de Variação – (CV)............................................................................................... 11 4.4.1 - Aplicações das Medidas de Dispersão no Mercado Financeiro........................................ 11 5 - Distribuição Normal de Probabilidade ou Distribuição de Gauss............................................ 12 6 - Exercícios..................................................................................................................................... 17 7 - Bibliografia................................................................................................................................... 23 8 - Trabalho de Estatística Aplicada ................................................................................................. 24 2 1 - Introdução Há pelo menos duas hipóteses bem aceitas sobre a origem da palavra Estatística. Uma se refere à palavra grega statízio, que significa “estabelecer”, “verificar”; a outra se refere à palavra latina status, cujo significado é “estado”, “situação”. Ambos os significados nos são úteis ao se tratar da acepção moderna da palavra estatística, uma vez que a utilizamos para descrever quantitativamente uma determinada situação. Na Estatística, população se refere a todos os objetos ou indivíduos em estudo. Se estivermos interessados nas alturas dos alunos da Escola Dona Estela, todos esses alunos constituem nossa população. Porém ao considerar somente os alunos da turma 103 para determinação de alturas e sobre essas tirarmos conclusões sobre a população, estamos considerando somente um subconjunto, ou na linguagem estatística, uma amostra. Considere outras questões do tipo: quantos fósforos dentro de uma produção acenderão quanto riscados? Qual o tempo de duração das lâmpadas de uma determinada marca? Qual candidato à presidência vencerá as próximas eleições? Todas estas perguntas devem ser respondidas considerando-se uma amostra de cada do conjunto universo envolvido, pois é impossível testarmos todos fósforos e lâmpadas, ou indagarmos todos os eleitores sobe suas preferências. Vemos, portanto, a necessidade da adoção do conceito de amostra em nossas determinações quantitativas. • População se refere a todos os objetos ou indivíduos em estudo. • Amostra: parte da população sobre a qual inferimos conclusões sobre a população. Variável Aleatória: uma definição simples de variável aleatória se refere aos possíveis resultados em um experimento cujo resultado em um determinado momento não podemos conhecer. Ex.: Lançamento de um dado. Os resultados possíveis (chamados de espaço amostral) são 1, 2, 3, 4, 5 e 6; porém qual resultado especificamente sairá em um determinado lançamento, desconhecemos. Podemos observar na tabela a seguir, que cada coluna representa uma variável e seus valores, ou seja, o nome, a idade, o cargo, o sexo e a escolaridade são varáveis. Nome Idade Altura (m) Sexo Cargo Márcio 22 1,72 M Gerente Kleber 25 1,78 M Vendedor Carla 24 1,65 F Vendedor Maria 40 1,62 F Faxineiro Na tabela anterior, tem-se que algumas variáveis possuem valores numéricos e outras não. Aquelas que possuem valores numéricos, chamamos de Variáveis Quantitativas, enquanto as outras, denominamos de Variáveis Qualitativas. Portanto, são variáveis quantitativas, a idade, a altura e o número de filhos; e são variáveis qualitativas, o nome, o cargo, a nacionalidade e o desempenho. As Variáveis Quantitativas são classificadas em Discretas ou Contínuas. 3 Variáveis Quantitativas Discretas: são aquelas que assumem somente valores inteiros não negativos, ou seja, 0, 1, 2, 3, 4... Na tabela anterior, a idade é um exemplo desse tipo de variável. Variáveis Quantitativas Contínuas: são aquelas que assumem qualquer valor no conjunto dos reais, considerando o limite de existência da mesma no contexto em questão. Na tabela anterior, a altura é um exemplo desse tipo de variável. De uma forma geral, as medições originam variáveis contínuas, enquanto as contagens ou enumerações originam variáveis discretas. As Variáveis Qualitativas, por sua vez, são classificadas em Ordinais ou Nominais. Variáveis Qualitativas Ordinais: são aquelas que apresentam algum tipo de ordenamento ou hierarquia. O cargo assumido por cada funcionário (gerente, vendedor ou faxineiro) pode ser ordenado segundo uma hierarquia. Variáveis Qualitativas Nominais: são aquelas que não têm ordenamento ou hierarquia. O sexo é um exemplo de variável qualitativa nominal. 2 - Organização dos Valores da Variável Aleatória Através de Tabelas Os dados obtidos através da pesquisa estatística devem ser apresentados de forma clara, direta e padronizada. Para tanto, é muito comum a utilização de tabelas e gráficos. 2.1 - Tabela Primitiva (Dados Brutos) e Rol Ao recolhermos dados de uma variável quantitativa, obtemos uma seqüência desordenada de números, como, por exemplo, as alturas dos 30 alunos mais jovens de uma determinada classe A dispostas abaixo. A esta disposição de dados chamamos Tabela Primitiva. Altura dos Alunos da Classe A em cm 165 168 155 176 180 167 174 164 160 179 177 162 163 178 156 157 168 155 164 178 156 173 170 175 180 169 171 173 168 170 Porém, esta disposição não nos ajuda muito em nossatarefa de investigação das informações. Para tanto, a forma ordenada dos dados abaixo, a qual denominamos Rol, é mais útil. Altura dos Alunos da Classe A em cm 155 160 165 169 173 178 155 162 167 170 174 178 156 163 168 170 175 179 156 164 168 171 176 180 157 164 168 173 177 180 4 2.2 - Distribuição de Freqüências Muitas vezes desejamos saber o número de indivíduos que possuem uma variável quantitativa a ele relacionado, no exemplo anterior, uma determinada altura. Para tanto, relaciona-se a cada altura, o número de indivíduos que a possuem. Altura dos Alunos da Classe A em cm Altura (cm) freqüência 155 2 156 2 157 1 160 1 162 1 163 1 164 2 165 1 167 1 168 3 169 1 170 2 171 1 173 2 174 1 175 1 176 1 177 1 178 2 179 1 180 2 total 30 Embora a inclusão da freqüência na tabela tenha nos fornecido mais informações, esta assumiu um aspecto não prático com um número excessivo de linhas. Para remediar o problema da situação anterior, criou-se o conceito de classe, que nada mais é, que intervalos de variação de uma variável quantitativa. Pode-se, por exemplo, dizer que o indivíduo com 155 cm pertence a classe 155 ├ 1601, ou seja, pertence a classe de todos os indivíduos que possuem altura igual ou superior a 155 cm e inferior a 165 cm. Desta forma, a tabela anterior assume o seguinte aspecto. Altura dos Alunos da Classe A em cm Altura (cm) freqüência 155 ├ 160 5 160 ├ 165 5 165 ├ 170 6 170 ├ 175 6 175 ├ 180 6 180 ├ 185 2 total 30 1 A simbologia 155 ├ 160 significa que a altura dos indivíduos desta faixa se encontra entre 155 inclusive e 166 exclusive, ou seja, 155 ≤ altura < 160. 5 Observa-se que o formato da tabela tenha sofrido uma significativa contração, porém perderam-se alguns dados, como por exemplo, não se sabe mais se há um indivíduo com 176 cm, sabemos unicamente que entre 175 cm e 180 cm, há 8 indivíduos. A introdução do conceito de classe traz agregada uma série de outras definições: Limite de Classe: são os extremos de uma classe: Há o limite superior(Li) e o limite inferior (li). Ex.: Na classe 170 ├ 175, tem-se Li = 175 e li =170. Freqüência Simples ou Freqüência Absoluta (fi): é o número associado a uma classe, ou a um valor individual, que reflete o número de observações que possuíam aquele valor. Ex.: Na tabela anterior, a freqüência da classe 175 ├ 180 é igual a 6. Isto significa que foi observado que havia 6 indivíduos com altura entre 175 cm e 180 cm, excluindo-se este último limite. Deve-se colocar o somatório das freqüências na última célula da coluna “freqüências”. Com relação às tabelas de dados agrupados e dados agrupados em classes, é comum determinarmos algumas freqüências, tais como as freqüências simples, relativas, acumulada crescente e acumulada decrescente. 2.3 - Tipos de Freqüência Utilizadas nas Tabelas Distribuídas em Classe 2.3.1 - Freqüência Simples ou Absoluta (fi ou Fi) e Freqüência Relativa (fri ou FRi) A freqüência com que os elementos ocorrem é uma informação essencial. Há diversos tipos de freqüência. Começaremos nosso estudo com a Freqüência Simples ou Absoluta, que é o número vezes que um determinado valor da variável em questão ocorre. Percebe-se que a soma das freqüências absolutas de cada classe é igual ao total de dados. Já a freqüência relativa de cada classe é obtida através da razão entre a freqüência absoluta e a freqüência total. FRi = ∑ i i F F Esta freqüência pode ser fornecida em ternos unitários ou em termos porcentuais. Como exemplo, basta considerar uma classe com 120 alunos, onde o número de alunos com altura entre 1,70 m e 1,80 m seja 60. A freqüência absoluta desta classe é F=60, enquanto a freqüência relativa é dada por FR=60/120 = 0,5 ou 50%. Quando é dada em termos percentuais, a freqüência relativa é comumente expressa por FP. 2.3.2 - Freqüência Acumulada Crescente (FAC) Freqüência acumulada crescente é a freqüência calculada em cada classe somando-se as freqüências de todas as classes inferiores à classe considerada, incluindo esta última. Como exemplo, considere a tabela a seguir. Altura dos Alunos da Classe A em cm Altura (cm) F FAC 155 ├ 160 5 5 160 ├ 165 5 10 165 ├ 170 6 16 170 ├ 175 6 22 175 ├ 180 6 28 180 ├ 185 2 30 total 30 6 Observe a FAC referente à classe daqueles que possuem altura entre 165 (inclusive) e 170 (exclusive). Este número foi obtido somando-se as freqüências de todas as classes anteriores, e expressa o número de alunos que possuem altura até 170 (exclusive). 2.3.3 - Freqüência Acumulada Decrescente (FAD) Freqüência acumulada decrescente é a freqüência calculada em cada classe somando-se as freqüências de todas as classes acima da classe considerada, incluindo esta última. Utilizando-se a mesma tabela anterior, podemos perceber que a FAD da classe 165 ├ 170 é de 20 alunos, e expressa o número de alunos que possuem altura superiores ou iguais a 165 cm. Altura dos Alunos da Classe A em cm Altura (cm) F FAD 155 ├ 160 5 30 160 ├ 165 5 25 165 ├ 170 6 20 170 ├ 175 6 14 175 ├ 180 6 8 180 ├ 185 2 2 Total 30 É muito comum a construção de tabelas contendo os diversos tipos de freqüência. Altura (cm) F FAC FAD FR FP 155 ├ 160 5 5 30 0,17 17% 160 ├ 165 5 10 25 0,17 17% 165 ├ 170 6 16 20 0,20 20% 170 ├ 175 6 22 14 0,20 20% 175 ├ 180 6 28 8 0,20 26% 180 ├ 185 2 30 2 0,07 7% Total 30 1 100% 2.3.4 - Histograma O histograma é um gráfico de colunas, onde no eixo horizontal, têm-se as classes consideradas e no eixo vertical, as freqüências absolutas de cada classe. A figura a seguir é o histograma da tabela. Altura (cm) F 155 ├ 160 3 160 ├ 165 4 165 ├ 170 5 170 ├ 175 4 175 ├ 180 3 Total 30 0 1 2 3 4 5 6 155 ├ 160 160 ├ 165 165 ├ 170 170 ├ 175 175 ├ 180 Classes Fi 3 - Medidas de Tendência Central para Conjuntos Não-Agrupados em Freqüências Há pelo menos duas hipóteses bem aceitas sobre a origem da palavra Estatística. Uma se refere à palavra grega statízio, que significa “estabelecer”, “verificar”; a outra se refere à palavra latina status, cujo significado é “estado”, “situação”. Ambos os significados nos são úteis ao se tratar da acepção moderna da ciência Estatística, uma vez que a utilizamos para descrever quantitativamente uma determinada situação a partir de medidas básicas, como média, mediana e moda. Passemos ao estudo das mesmas. 3.1 - Média Aritmética Simples A média aritmética é fornecida pela divisão entre o somatório dos valores numéricos dos dados e o número de dados. Sejam, por exemplo, n (sendo n um número inteiro) dados x1, x2, x3,...xn, a média aritmética é calculada por: X = n x n x...xxx in321 ∑ = ++++ Exemplo: Calcule a média aritmética dos números:1, 2, 4, 5, 8 e 10. Resolução: X = 5 6 30 ======== ++++++++++++++++++++ 6 1085421 A média aritmética é uma medida muito utilizada. Aparece no cálculo do desempenho dos alunos, no capital de uma empresa, na representação da altura, do peso e da idade, por exemplo, dos indivíduos de uma turma. Exemplo: Seis pessoas desejam reunir capital para abrir uma empresa. Sabendo-se que três pessoas contribuirão com R$800.000,00, uma pessoa com R$1.000.000,00 e as duas últimas contribuirão com R$500.000,00, calcule a média de capital por pessoa. Resolução: Temos os seguintes valores: 800.000,00, 800.000,00, 800.000,00, 1.000.000,00, 400.000 e 400.000,00. Basta somá-los e dividi-los por seis. Podemos trabalhar com um número menor de zeros, ou seja, dividir todos os valores por 100.000 e depois multiplicar o resultadofinal por 100.000. 7 6 42 6 4410888X ========++++++++++++++++++++==== Cada pessoa entrou em média com o capital de R$ 700.000,00. 3.2 - Média Aritmética Ponderada A média ponderada é obtida dividindo-se pelo número de valores da variável, o somatório do produto de cada valor da variável pelo seu respectivo peso. Consideremos, por exemplo, as variáveis x1, x2, x3,...xn e seus respectivos pesos p1, p2, p3,...pn, a média aritmética ponderada é dada por: ∑ ⋅⋅⋅⋅++++++++⋅⋅⋅⋅++++⋅⋅⋅⋅++++⋅⋅⋅⋅ ==== n i i nn332211 AP p px...pxpxpxX Exemplo: Calcule a média ponderada das notas 5, 6 e 5. Sabendo que seus pesos são respectivamente 1, 2 e 1. Resolução: 5,5====++++++++==== 4 5.16.2.1 5XP 8 A mediana ocupa a 4a posição. A mediana ocupa uma posição entre a 4a e a 5a posições. É determinada através da média aritmética entre os elementos da 4a e 5a posições: Md= 5,5 2 65 = + Exemplo: Em uma empresa, o capital é formado por três fontes: acionistas, financiamento proveniente do Banco A e financiamento do Banco B. Cada um desses capitais tem um “custo” diferente para a empresa, ou seja, para o capital proveniente dos acionistas, a empresa paga 10% de juros anuais; para o capital financiado pelo Banco A, paga-se 12% ao ano e para o capital financiado pelo Banco B, paga-se 14% ao ano. Desejando-se saber a taxa média de juros anuais, a empresa pede a você que a obtenha através de cálculos ponderados, considerando a participação de cada capital como o peso aplicado a cada taxa. Utilize os dados da tabela a seguir. Capital da Empresa Taxa de Juro Anual Participação (R$) Acionistas 10% 6.000.000,00 Financiamentos do Banco A 12% 500.000,00 Financiamentos do Banco B 14% 3.000.000,00 Devemos interpretar a tabela acima da seguinte forma: a taxa de 10% tem peso igual a 6.000.000, ou simplificando através da divisão do peso por 1.000.000, a taxa de 10% tem peso igual a 6; a taxa de 12% tem peso igual a 0,5 e finalmente a taxa de 14% tem peso igual a 3. %37,11 5,9 108 9,5 .341.0,521.6 10XP ==++= . A empresa deverá pagar em média 11,37% de juros. 3.3 - Moda Moda de um conjunto simples é o elemento de maior freqüência do conjunto considerado. O conjunto pode apresentar mais de uma moda, caso vários elementos possuam freqüências superiores a um e que as mesmas sejam iguais. Exemplos: a) 2, 3, 4, 5, 6: conjunto amodal → não há moda. b) 2, 2, 3, 4, 5, 6: conjunto unimodal → Mo=2. c) 2, 2, 3, 3, 4, 5, 6: conjunto bimodal →Mo=2 e Mo=3. d) 2, 2, 3, 3, 4, 4, 5, 6: conjunto multimodal →Mo=2, Mo=3 e Mo=4. e) 2, 2, 3, 3, 4, 4: conjunto amodal → não há moda, pois os elementos se repetem na mesma intensidade. 3.4 - Mediana Mediana é a medida que ocupa a posição central em um rol de valores. Devemos considerar dois casos: número ímpar de dados e número par de dados. a) Número ímpar de dados: 2 3 5 6 7 10 11. b) Número par de dados: 2 2 3 5 6 7 10 11. 9 4 - Medidas de Dispersão ou de Variabilidade As medidas de tendência central estudadas anteriormente nos fornecem uma forma quantitativa eficiente de representar uma seqüência numérica, sem, contudo, nada informarem sobre a dispersão dos dados, ou seja, nada dizem sobre o afastamento dos valores dos dados observados com relação a uma referência. Como exemplo, podemos citar os seguintes conjuntos de valores abaixo que se referem às alturas, em centímetros, de 3 grupos de indivíduos: 1) 180, 180, 180, 180, 180 2) 178, 179, 180, 181, 182 3) 170, 175, 180, 185, 190 Pode-se observar que os três conjuntos possuem a mesma média aritmética, 180 cm, porém dispersões diferentes. A amostra 1 é mais homogênea que as amostras 2 e 3 no que se refere ao afastamento dos valores em relação a média, ou seja, menos dispersa. Já amostra 3 é a mais dispersa. Embora a dispersão muitas vezes seja visualmente perceptível, é necessário que se transponha esta noção meramente qualitativa e se criem formas quantitativas de expressá-la. Para tanto, foram criadas diversas medidas: amplitude total, desvio médio, desvio padrão, variância e coeficiente de variação. 4.1 - Amplitude Total – (AT) A amplitude total (AT) é definida como a diferença entre o maior e o menor valor observado: AT = xmáx. – xmín. Exemplo: Calcule a amplitude total dos valores a seguir: 2, 3, 1, 5, 7, 4 → AT = 7-1 = 6 Embora a amplitude total seja uma medida tecnicamente fácil de ser obtida, ela possui significado limitado, uma vez que só considera as medidas extremas dos conjuntos de valores abordados. Em última análise, a AT só nos fornece com a amplitude do conjunto de valores, nada nos fornecendo sobre o comportamento dos números entre estas medidas extremas. A AT é muito utilizada quando desejamos obter rapidamente uma medida rudimentar da dispersão de valores. 4.2 - Desvio Médio ou Média dos Desvios – (DM) O desvio médio (DM) é quantificação mais sofisticada de uma dispersão de valores, considerando como referência a média dos valores. A expressão abaixo se obtém considerando-se os afastamentos de cada elemento do conjunto em relação à média do conjunto (como no gráfico seguinte relativo ao exemplo) que são justamente os desvios da média como visto anteriormente, XXD ii −= . A média dos módulos dos desvios médios me fornece o quanto os valores estão, em média, afastados da média. Para valores não agrupados, a expressão do desvio médio assume o seguinte aspecto: n XX MD n 1i i∑ ==== −−−− ==== Exemplo: Calcule o DM da distribuição: 1, 2, 3, 6 e 7. X = 4,2 10 ∑ = − n 1i i XX = 2,32,28,08,18,28,378,368,338,328,31 ++++=−+−+−+−+− → 8,35 19DM == Embora esta medida ofereça um certo aprimoramento em relação à amplitude total, este vem às custas da introdução de uma expressão modular. Além disso, é uma medida de significado particular, pois depende da natureza da variável em estudo, ou seja, um desvio médio de 0,3 cm na análise de valores que representam altura, pode não significar muito, indicando baixa dispersão, mas certamente significará grande dispersão se a variável em estudo for o diâmetro da íris dos olhos das pessoas de um grupo. 4.3 - Desvio Padrão - (DP, s ou σσσσ) O desvio padrão é a medida de dispersão mais utilizada, tendo em comum com o desvio médio o fato de ambas as medidas serem obtidas considerando-se a média como referência. O desvio padrão, representado por s (no caso de amostra ), σσσσ (no caso de universo) ou DP, é dado pela raiz quadrada da média aritmética dos quadrados dos desvios obtidos. ( ) n XX DP 2 i∑ − =σ= É necessário que se observe que quando o desvio padrão for calculado a partir de amostras, caso mais freqüente em Estatística, se utiliza “n-1” e não “n” no denominador. ( ) 1-n XX DP 2 i∑ − == s 0 1 2 3 4 5 6 7 8 9 10 I 1-3,8 I=2,8 I 2-3,8 I=1,8 I 7-3,8 I=3,2 I 6-3,8 I=2,2 I 3-3,8 I=0,8 média=3,8 11 4.4 - Coeficiente de Variação – (CV) As medidas de dispersão estudadas até este ponto mostram uma sofisticação crescente no que se refere aos cálculos matemáticos. Porém, todas carecem de significado absoluto, ou seja, não nos dizem muito se considerarmos conjuntos cujoselementos assumem amplitudes diferentes. Suponha, por exemplo, que desejamos determinar qual dos dois conjuntos a seguir apresenta maior dispersão, o conjunto cuja média é 125 e DP=25, ou o conjunto cuja média é 20 e o DP=5. Seria uma questão aparentemente fácil para se responder neste momento, uma vez DP=20>DP=5. Porém, devemos notar que no universo de valores que forneceram uma média igual a 120, um desvio padrão igual a 25 equivale a 20% da média, enquanto que no segundo caso, o desvio padrão equivale a 25% da média (5 é 25% de 20). A dispersão do segundo conjunto, portanto, é 5% maior que a do primeiro conjunto. Repare que neste caso, a simples consideração concomitante da média e do desvio padrão já nos induz a idéia de um valor percentual entre média e desvio padrão. Criou-se, portanto, uma medida denominada coeficiente de variação, definida como a razão entre o desvio padrão e a média, expressa em termos percentuais, sendo uma excelente opção quando desejamos comparar conjuntos de diferentes magnitudes ou natureza (altura e peso, por exemplo). .100 x DPCV = Suponha que desejamos comparar a dispersão entre a altura e a idade dos alunos de uma escola, sabendo-se que em relação a altura tem-se os seguintes dados: x =170 cm e s=10 cm; e em relação às idades, sabe-se que: x =15 anos e s=1,2 anos. Basta calcularmos o coeficiente de variação para cada variável (altura e idade): === 100. 170 10 .100 x sCV 5,88% e === 100. 15 1,2 .100 x sCV 8,00% Percebe-se, então, que a altura oferece uma menor dispersão (5,88%), quando comparada à idade (8,00%). 4.4.1 - Aplicações das Medidas de Dispersão no Mercado Financeiro A Estatística Descritiva é utilizada em algumas análises simples características do mercado financeiro, que se relacionam com a avaliação de riscos. A idéia de risco está associada a idéia de dispersão dos resultados em relação à média, ou seja, quanto maior a dispersão, maior o risco. Como exemplo, analisemos os investimentos A e B cujas taxas de rendimento ao longo dos meses são apresentadas a seguir. Meses Janeiro Fevereiro Março Abril Maio Média DP CV Investimento A (%) 2,2 2,3 3,2 1,9 3,2 2,56 0,60 23,53 Investimento B (%) 1,2 5,1 4,4 6,6 2,8 4,02 2,09 51,89 Percebe-se que o investimento B apresenta maior taxa média de rendimento ao longo dos 5 meses, 4,02% contra os 2,56% do investimento A, porém os valores de suas taxas se encontram mais dispersos em relação a média que as taxas do investimento A, como mostra o coeficiente de variação e os gráficos a seguir, o que nos leva a classificar o investimento B como o de maior risco. 12 Note que na análise anterior temos duas questões a considerar: o risco e a taxa de rendimento. Embora o investimento B ofereça maior risco, também oferece maior taxa de rendimento, o que poderia levar um investidor mais ousado a escolhê-lo. 5 - Distribuição Normal de Probabilidade ou Distribuição de Gauss Podemos definir PROBABILIDADE de uma forma simples como a quantificação das chances de uma variável aleatória ocorrer. Por exemplo, quando lançamos um dado, sabemos que podemos obter um resultado expresso por um número par, uma vez que a sequência de resultados pode ser representada pelo conjunto {1, 2, 3, 4, 5, 6}. Porém apenas dizer que temos chances é um posicionamento demasiadamente qualitativo, há a necessidade de QUANTIFICAR a expressão "ter chances". Para isto, existem diversos modelos de probabilidade, ou seja, técnicas matemáticas para obtenção desta quantificação. Neste item, estudaremos a Distribuição Normal, que pode ser considerada como a mais importante das distribuições de probabilidades, sendo utilizada para o cálculo de probabilidades de variáveis aleatórias contínuas como alturas, pesos, diâmetros de tampas de embalagens, precipitações pluviométricas, comprimentos de peças em linhas de produção, contagem de QI e diversas outras medições em pesquisas científicas. Todas estas variáveis citadas anteriormente possuem distribuição de freqüência no padrão da curva normal (ou curva de Gauss), como mostra a figura a seguir. Nesta teoria é comum expressarmos a média e o desvio padrão através das letras gregas µµµµ (pronuncia-se: "mi") e σσσσ (pronuncia-se: "sigma") respectivamente. As curvas que possuem distribuição normal possuem as seguintes características: a. A probabilidade de ocorrência de um valor "x" da variável no intervalo ] x1, x2 [ , P(x1 ≤ x ≤ x2), é dada pela área sob o gráfico e acima do intervalo ] x1, x2 [. 0 1 2 3 4 0 1 2 3 4 5 6 meses ta x as (% ) Investimento A 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 meses ta x as (% ) Investimento B x1 x2 P( x1 ≤ x ≤ x2 ) 13 b. As curvas normais se diferenciam por suas médias µ e desvios-padrões σ, como mostrado nas figuras 1 e 2. c. O ponto de máximo da curva normal corresponde a média, a mediana e a moda da distribuição. d. A média da distribuição pode assumir qualquer valor, negativo, zero ou positivo. e. A curva normal é simétrica em relação a média e assintótica em relação ao eixo horizontal, tanto para esquerda como para a direita (nunca toca o eixo, porém sempre se aproxima do mesmo). f. O desvio-padrão determina a largura da curva; desvios padrões maiores resultam em curvas mais achatadas, como mostrado a seguir. g. É comum considerarmos a probabilidade de ocorrência nos intervalos σ±µσ±µσ±µ e2,3 , as quais são indicadas a seguir. 14 Distribuição Normal-Padrão de Probabilidade Diz-se que uma variável aleatória contínua possui distribuição normal-padrão de probabilidade quando apresenta uma distribuição normal com média zero e desvio-padrão unitário, µ=0 e σ=1, como mostrado a seguir: Como mencionado anteriormente, a probabilidade de encontrarmos um valor em um intervalo é dada pela área sob a curva. Para a distribuição normal-padrão, esta área é tabelada para diversos intervalos, como mostrado na tabela a seguir. Porém, para "transformarmos todas as distribuições normais em distribuições normais reduzidas, é necessário transformarmos a variável "x" na variável "z", através da expressão σ µ− = x z , possibilitando a utilização da tabela já conhecida. Analisemos a seguinte situação. Exemplo: Os pesos de 500 estudantes são normalmente distribuídos com média igual a 67,8kg e desvio-padrão igual a 6,2kg. Determine a probabilidade de encontrarmos um estudante com peso entre 70kg e 80kg. Solução: Tem-se µ=67,8 kg e σ=6,2kg. Executa-se a seguinte mudança de variável 2,6 8,67xx z − = σ µ− = . Calculamos z1 e z2: 36,0 2,6 8,6770 z1 = − = e 98,1 2,6 8,6780x z2 = − = σ µ− = Na tabela, ilustra-se procedimento para se encontrar a probabilidade )70x0(P << , resultando em 0,1406. Utilizando-se o mesmo procedimento, encontra-se )80x0(P << igual a 0,4761; como desejamos )80x70(P ≤≤ , fazemos )70x0(P)80x0(P)80x70(P ≤≤−≤≤=≤≤ , resultando em %50,38ou3850,01406,04761,0)80x70(P =−=≤≤ , ou seja, há 38,50% de probabilidade de encontrarmos alguém com peso entre 70kg e 80kg no grupo analisado. 15 Tabela: Probabilidades para a distribuição normal padrão. z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,19500,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 Exemplo: Suponha que o brasileiro adulto tenha altura média de 1,78m, com desvio-padrão de 10cm. Determine. a. Qual a probabilidade de um homem adulto ter mais de 1,80m? b. Qual a probabilidade de um homem adulto ter menos de 1,70m? c. Qual a probabilidade de um homem adulto ter altura entre 1,70m e 1,80m? Solução: Tem-se µ=1,78m kg e σ=0,01m. Façamos a mudança de variável 01,0 78,1xx z − = σ µ− = . a. A probabilidade de um homem adulto ter mais de 1,80m, ou seja, )80,1x(P ≥ , é dada pela probabilidade complementar )80,1x(P1 ≤− , tem-se então que calcular )80,1x(P ≤ . 00,2 01,0 02,0 01,0 78,180,1x z == − = σ µ− = . Verificando na tabela anterior, tem-se que a área sob a curva quando z=2,00 é igual a 0,4772 ou 47,72%, logo, a probabilidade de alguém ter mais de 1,80m é 1-0,4772 = 0,5228 ou 52,28%. 16 b. Calculemos 00,2 01,0 02,0 01,0 78,170,1x z −=−= − = σ µ− = , como a tabela não fornece a área para valores negativos de z, consideramos o módulo de z, que nos fornece uma área simétrica em relação a média, ou seja, 0,4772 ou 47,72%. c. A probabilidade de um homem adulto ter altura entre 1,70m e 1,80m é dada através de duas áreas simétricas em relação a média, ou seja, %44,95ou9544,04772,04772,0)80,1x70,1(P =+=≤≤ . 17 6 - Exercícios Classificação da Variáveis 1) Classifique as variáveis a seguir (qualitativas nominais ou ordinais; quantitativas discretas ou contínuas) Universo: alunos de Estatística Aplicada População: cor dos olhos Universo: alunos de Matemática Financeira População: tamanho do bíceps (medido em circunferência) Universo: ambiente em uma empresa População: cargos assumidos por seus funcionários Universo: famílias residentes no Rio de Janeiro População: número de filhos Universo: alimento consumido em uma festa População: número de copos de cerveja Universo: mulheres que assistem à Estatística Aplicada População: cor do cabelo Universo: número de parafusos produzidos em uma fábrica. População: diâmetro dos parafusos Organização dos Valores da Variável Aleatória Através de Tabelas 2) Foram recolhidas as notas de Português dos alunos de uma escola. Faça uma tabela com dados agrupados em freqüência apenas para expor as notas. 8 9 3 4 1 1 7 2 5 8 7 7 3 6 0 4 7 0 3 3 8 3 7 8 9 8 4 1 6 3 7 8 18 3) Foram coletadas as notas dos alunos de uma escola na disciplina Estatística. Faça uma tabela com a distribuição de freqüências e com os dados agrupados em classes. 1,2 1,0 2,4 2,6 4,1 6,9 2,9 7,1 2,1 3,3 6,4 2,9 8,3 3,5 6,2 5,7 9,3 4,2 4) Foram coletadas as alturas dos alunos de uma escola. Faça uma tabela com distribuição de freqüências e dados agrupados em classes. 1,67 1,78 1,59 1,77 1,89 1,78 1,54 1,84 1,92 1,81 1,95 1,78 1,80 1,66 1,83 1,63 1,63 1,68 1,67 1,78 1,61 1,78 1,67 1,52 1,51 5) Considerando os dados das tabelas dos exercícios 2 e 3, construa tabelas com cinco classes de igual amplitude expondo as notas e as alturas desses alunos. Nas mesmas tabelas, calcule a FAC, a FAD, a FR e a FR(%). 6) Na tabela a seguir, encontram-se as alturas (em centímetros) dos operários de uma empresa com 100 operários. a) Preencha a tabela distribuída em classes abaixo; b) Calcule a média, mediana e moda. Operário Altura (cm) Operário Altura (cm) Operário Altura (cm) Operário Altura (cm) 1 164 26 173 51 181 76 189 2 164 27 173 52 181 77 189 3 166 28 173 53 181 78 189 4 166 29 173 54 182 79 189 5 166 30 173 55 182 80 189 6 166 31 174 56 182 81 189 7 166 32 174 57 182 82 189 8 166 33 174 58 183 83 189 9 166 34 175 59 183 84 189 10 167 35 175 60 183 85 189 11 167 36 175 61 183 86 190 12 167 37 175 62 184 87 190 13 167 38 175 63 184 88 190 14 168 39 176 64 184 89 190 15 168 40 176 65 185 90 190 16 168 41 176 66 185 91 190 17 169 42 177 67 185 92 191 18 169 43 177 68 185 93 191 19 169 44 177 69 185 94 191 20 169 45 177 70 186 95 191 21 169 46 178 71 186 96 191 22 169 47 178 72 186 97 191 23 170 48 178 73 186 98 191 24 170 49 179 74 187 99 191 25 170 50 179 75 187 100 191 19 Alturas (cm) Fi FAC FAD FR (%) 160 ├ 165 165 ├ 170 170 ├ 175 175 ├ 180 180 ├ 185 185 ├ 190 190 ├ 195 ∑ ∑ 7) Bruna, após freqüentar as aulas de Estatística, prestou consultoria para uma empresa que desejava interpretar as informações contidas na tabela a seguir. Determine: - O salário de maior ocorrência. - Quantos funcionários há na empresa? - Através da coluna de FAC, determine quantos funcionários ganham até R$2.700,00. - Através da Coluna de FAD, determine quantos funcionários têm salários iguais ou acima de R$2.200,00. - O percentual de funcionários que ganham entre R$1.200,00 e R$3.200,00. - O histograma da distribuição de freqüências. Salários (reais) fi 700 1200 5 1200 1700 28 1700 2200 36 2200 2700 12 2700 3200 9 3200 3700 6 8) Márcio é um ex-aluno do curso de Administração da Universidade Estácio de Sá, que presta consultoria a diversas empresas. Atualmente, Márcio se encontra envolvido em uma ampla consultoria a uma firma de importação de frutas e se detém na análise das quantidades importadas de kiwi. Sabendo-se que o exportador suíço enviou a tabela abaixo de distribuição da pesagem de 30 caixas de kiwi e as respectivas medidas estatísticas, média=5,6Kg, moda=5,9Kg e mediana=5,7Kg, faça os itens abaixo. - Considerando-se a tabela de distribuição de pesos abaixo correta, determine quais das medidas fornecidas anteriormente (média, mediana e moda) estão corretas. - Faça a coluna da FAC e determine quantas caixas estão com peso até 6,0Kg (exclusive). - Faça a coluna da FAD e determine quantas caixas estão com peso acima de 5,8Kg (inclusive). - Determine o número de caixas entre 5,4Kg e 6,2Kg. Pesos (Kg) Número de Caixas 5,2 ├ 5,4 2 5,4 ├ 5,6 3 5,6 ├ 5,8 5 5,8 ├ 6,0 7 6,0 ├ 6,2 26,2 ├ 6,4 6 6,4 ├ 6,6 5 ∑ 30 20 Medidas de Tendência Central 9) Considerando os conjuntos de dados, calcule a média, a mediana e a moda: a) 3, 5, 2, 6, 5, 9, 5, 2, 8, 6 b) 20, 9, 7, 2, 12, 7, 20, 15, 7 c) 51,6; 48,7; 50,3; 49,0; 48,4 d) 15, 18, 20, 13, 10, 16, 14 10) João obteve as seguintes notas no período passado, sendo que cada disciplina possuía um peso diferente, como exposto na tabela abaixo. Determine a média de João no período citado. Disciplina Nota (Xi) Peso (Pi) Matemática Financeira 8 3 Estatística 6 5 Direito 5 3 Contabilidade 5 2 ∑ 11) Márcio obteve as seguintes notas em um concurso público, sendo que cada disciplina possuía um peso diferente, como exposto na tabela abaixo. Determine o peso da disciplina Matemática, sabendo-se que a média ponderada de Márcio no concurso foi 7,1. Disciplina Nota (Xi) Peso (Pi) Matemática 8 x Português 6 2 Geografia 5 1 História 5 1 Química 9 2 Biologia 7 1 ∑ 12) Cinco pessoas desejam reunir capital para abrir uma empresa. Sabendo-se que duas pessoas contribuirão com R$500.000,00, uma pessoa com R$800.000,00 e as duas últimas contribuirão com R$700.000,00, calcule a média de capital por pessoa. 13) Dez pessoas desejam reunir capital para realizar um investimento no mercado financeiro. A média do capital desse grupo é de R$12.000.000,00. Após algumas deliberações, duas dos dez pessoas abandonaram o grupo, levando embora os capitais de R$ R$8.000.000,00 e R$ 6.000.000,00. Simultaneamente a saída dessas pessoas, quatro novas pessoas foram admitidas, incorporando R$ 3.000.000,00 cada uma ao capital para investimento. Baseado nessas informações, calcule o novo capital médio do grupo. 14) Em uma empresa, o capital é formado por quatro fontes: acionistas, financiamento proveniente do Banco Partner, financiamento do Banco Development e debêntures. Cada um desses capitais tem um “custo” diferente para a empresa, ou seja, para o capital proveniente dos acionistas, a empresa paga 10% de juros anuais; para o capital financiado pelo Banco Partner, paga-se 12,5% ao ano; para o capital financiado pelo Banco Development, paga-se 11,5% ao ano e em relação às 21 debêntures, paga-se 13% ao ano. Desejando-se saber a taxa média de juros anuais, a empresa pede a você que a obtenha através de cálculos ponderados, considerando a participação de cada capital como o peso aplicado a cada taxa. Utilize os dados da tabela a seguir. Capital da Empresa Taxa de Juro Anual Participação (R$) Acionistas 10% 3.000.000,00 Financiamentos do Banco Partner 12,5% 800.000,00 Financiamentos do Banco Development 11,5% 2.000.000,00 Debêntures 13% 800.000,00 Medidas de Dispersão ou Variabilidade 15) Em relação aos números abaixo, calcule as amplitudes totais, os desvios da média, os desvios padrão e os coeficientes de variação: a) 3, 4, 6, 20 b) 2, 2, 2, 3, 3, 6, 7, 7, 8 c) 1,2; 1,2; 1,3; 1,6; 1,8 16) Medidas as estaturas de 1.017 indivíduos, obtivemos média de 162,2 cm e desvio padrão de 8,01 cm. O peso médio desses indivíduos é de 52 kg, com um desvio padrão de 2,3 kg. Esses indivíduos apresentam uma maior variabilidade em relação ao peso ou à estatura? 17) Márcio e Jorge são dois investidores que procuram onde aplicar seus capitais. Márcio é bem conservador, optando sempre pelos investimentos mais seguros, enquanto Jorge é mais ousado, aceitando maiores riscos, contanto que tenha alguma compensação em termos de maiores rendimentos. Considerando os investimentos abaixo, determine o que provavelmente cada um escolheria. Meses Janeiro Fevereiro Março Abril Maio Média DP CV Investimento A 1,2% 3,3% 3,2% 1,9% 3,2% Investimento B 3,2% 5,1% 5,4% 2,6% 2,8% 18) As decisões financeiras devem ser tomadas em função dos retornos e dos riscos esperados, e do respectivo impacto dos mesmos sobre o preço do ativo avaliado. O risco de um ativo individual, uma ação, por exemplo, pode ser devidamente avaliada através da variabilidade dos retornos esperados. Portanto, a comparação das distribuições probabilísticas dos retornos, relativas a cada ativo individual, possibilita a quem toma decisões perceber os diferentes graus de risco. Analise, a seguir, os dados estatísticos relativos aos retornos de 5 ativos. Dados estatísticos referentes aos retornos Ativo A Ativo B Ativo C Ativo D Ativo E Valor esperado (média) 15,0% 12,0% 5,0% 10,0% 4,0% Desvio-padrão 6,0% 6,6% 2,5% 3,0% 2,6% Coeficiente de variação 0,40 0,55 0,50 0,30 0,65 O ativo MENOS arriscado é o: a) A b) B c) d) D e) E 22 19) A Santa Maria Material Esportivo Ltda. selecionou cinco projetos objetivando atender às suas necessidades de aumento da capacidade de produção. Os dados resumidos, relativos a cada um desses projetos, estão na seguinte tabela. Utilize o Excel. Projeto Retorno Esperado (%) Desvio Padrão do Retorno (%) V 20,0 6,0 X 10,0 4,0 W 20,0 7,0 Y 16,0 5,0 Z 30,0 11,0 Considerando o risco relativo (Risco/Retorno Esperado), o mais recomendável é o projeto: a) V b) X c) W d) Y e) Z 20) Um grupo americano deseja investir na indústria naval. Com esta finalidade, requisitou a você, aluno conhecedor das medidas estatísticas, que realizasse uma análise de risco de investimento baseado no coeficiente de variação das receitas da indústria naval de cinco países entre os meses de janeiro a junho. Sabendo-se que quanto menor o coeficiente de variação, menor o risco associado ao investimento, determine o investimento de menor risco. Receita (milhões de dólares) País Janeiro Fevereiro Março Abril Maio Junho Brasil 10 7 1 15 13 7 Colômbia 15 14 10 14 14 13 Peru 11 15 5 10 3 11 Venezuela 9 6 9 14 15 5 Argentina 14 2 14 11 11 11 Dados fictícios. 21) É comum a utilização do coeficiente de variação para quantificar o risco de investimentos no mercado financeiro. O investidor ousado faz opção pelos investimentos de maiores riscos, contanto que tenha alguma compensação em termos de maior rentabilidade (maior taxa média de juros), enquanto os investidores conservadores dão preferência aos investimentos mais seguros. Qual dos investimentos abaixo seria mais adequado a um investidor ousado? Meses Investimento A (taxa de juros %) Investimento B (taxa de juros %) Investimento C (taxa de juros %) Janeiro 1,3 2,1 1,6 Fevereiro 1,8 1,7 2,5 Março 1,7 1,4 1,6 Abril 2,2 1,3 1,6 Maio 1,4 1,3 1,4 Junho 1,5 1,3 1,7 DPA = 0,327 DPB = 0,325 DPC =0,388 23 Distribuição Normal 22) A idade média para uma pessoa se casar pela primeira vez é 26 anos (U.S. News & World Report, 6 de junho de 1994). Considere que as idades para o primeiro casamento tenham uma distribuição normal com um desvio-padrão de quatro anos. a. Qual é a probabilidade de que uma pessoa que se casa pela primeira vez tenha menos de 27 anos? b. Qual é a probabilidade de que uma pessoa que se casa pela primeira vez esteja entre 25 e 27 anos? 23) Um pesquisador verificou que em uma cidade do interior de SP, o peso dos homens tem uma distribuição aproximadamente normal com média de 85kg e desvio-padrão de 20kg, enquanto o das mulheres também apresenta-se normalmente distribuído, com média de 60kg e desvio-padrão de 8kg. Pede-se: a. Sorteando-se um homem, qual a probabilidade do mesmo apresentar peso acima de 75kg? b. Sorteando-se uma mulher, qual a probabilidade da mesma apresentar peso acima de 65kg? 7 - Bibliografia CRESPO Antônio Arnot. Estatística Fácil, Rio de Janeiro, ed. Saraiva, 1999. WITTE, R. S., WITTE,R. S. Estatística. LTC Editora, 2005 IMENES, L.. M., Estatística (Para que Serve a Matemática). São Paulo: Atual, 2000. BUNCHAFT, G. & KELLNER, S. Estatística sem mistério. Rio de Janeiro: Vozes,, 1998-1999. V.4 DOWNING, D. & CLARR, J. Estatística Aplicada. São Paulo: Saraiva, 2000. MORETTIN, L.G. Estatística Básica. 7. ed. São Paulo: Makron, 1999. v.1 TOLEDO, G.L. & OVALLE, I.I. Estatística Básica. 2. ed. São Paulo: Atlas, 1995. FONSECA, J. S. da. Estatística Aplicada. São Paulo: Atlas, 1998. FONSECA, J.S. da. & MARTINS, S. Curso de Estatística. 6. ed. São Paulo: Atlas, 1996. KASMIER, L. Estatística Aplicada a Economia e a Administração. São Paulo: McGraw Hill, 1982. SPIEGEL, M. Estatística. 3. ed. São Paulo: Makron, 1994. STEVENSON, W.J. Estatística Aplicada a Administração. São Paulo: Harbra, 1986. 24 8 - Trabalho de Estatística Aplicada Universidade Estácio de Sá Roteiro Simplificado para o Trabalho de AV1 e AV2 da Disciplina Estatística Aplicada Professor João Mattos Rio de Janeiro/2o período de 2015 O trabalho para a AV1 e AV2 consiste nos itens a seguir especificados e a planilha do excel utilizada para a execução dos cálculos deverá deve ser entregue até a data de realização da AV2 através do e-mail herrhueber@yahoo.com.br, sendo a nota parcial fornecida até a AV1 (máximo de dois pontos). O trabalho deve ser feito preferencialmente em grupo (máximo de seis integrantes). No corpo do e-mail que encaminhará a planilha em anexo, deverão constar os nomes dos integrantes dos grupos. Item 1) O grupo deverá escolher 50 pessoas com idade superior a 18 anos e coletar os dados referentes a altura e peso. Item 2) Os dados coletados no item 1, devem ser organizados em duas tabelas por frequência (Fi, FAC, FAD e FR(%)), como nas figuras a seguir. Altura (cm) F FAC FAD FR(%) 145 ├ 150 150 ├ 155 155 ├ 160 160 ├ 165 165 ├ 170 170 ├ 175 175 ├ 180 180 ├ 185 185 ├ 190 190 ├ 195 195 ├ 200 Total 25 Peso (kg) F FAC FAD FR(%) 45,0 ├ 47,5 47,5├ 50,0 50,0 ├ 52,5 52,5 ├ 55,0 55,0 ├ 57,5 57,5 ├ 60,0 60,0 ├ 62,5 62,5 ├ 65,0 65,0 ├ 67,5 70,0 ├ 72,5 75,0 ├ 77,5 80,0 ├ 82,5 85,0 ├ 87,5 87,5 ├ 90,0 90,0 ├ 92,5 Total Item 3) Determinar a média e o desvio-padrão do conjunto de alturas e do conjunto de pesos e verificar qual dos conjuntos é mais disperso. Item 4) Determinar se os conjuntos se encaixam aproximadamente em uma curva normal.
Compartilhar