Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA Exercícios Comentados UNIDADE 1 Tópico 3 Exercício Comentado 1. A tabela a seguir mostra a matrícula inicial e a matrícula final da escola R de Canela/ RS em 2003. MATRÍCULAS DA ESCOLA EM CANELA/RS EM 2003 Série MI MF 1ª 45 66 2ª 39 37 3ª 32 27 4ª 18 16 Total 134 146 FONTE: Secretaria da escola R. 2003 a) Calcular a taxa de evasão por série. b) Calcular a taxa de evasão da escola. Solução: a) Calculam-se os coeficientes de evasão através de MI MFCE MI − = para cada uma das séries: 1ª série: 45 66 21CE 0,4667 45 45 − − = = = − , ou seja, 46,67 de adesão. 2ª série: 39 37 2CE 0,0513 39 39 − = = = , ou seja, 5,13% de evasão. 3ª série: 32 27 5CE 0,1562 32 32 − = = = , ou seja, 15,62% de evasão. 4ª série: 18 16 2CE 0,1111 18 18 − = = = , ou seja, 11,11% de evasão. b) Para o coeficiente de evasão total da escola usam-se os totais: 134 146 12CE 0, 0896 134 134 − − = = = − , ou seja, 8,96% de adesão. UNIDADE 1 Tópico 3 Exercício Comentado 2. Uma frota de 25 caminhões, transportando, cada um, 14 toneladas, dirigindo-se a duas cidades A e B. Na cidade B foram descarregados 65% desses caminhões, por 7 homens, sendo que, 4 deles trabalharam 7 horas cada um e os outros, 9 horas cada um. Os caminhões restantes seguem para a cidade A, onde 5 homens gastaram 7 horas cada um para o seu descarregamento. Calcule a produtividade de cada uma das equipes. Solução: Os 25 caminhões com 14 toneladas cada um transportam 350 toneladas. Na cidade B foram descarregados 65% dos caminhões, ou seja, 65% de 350 toneladas, que correspondem a 227,5 toneladas. A equipe que trabalhou na cidade B era constituída de 7 homens, sendo que 4 deles trabalharam por 7 horas, ou seja, 28 horas de trabalho, enquanto que os outros 3 homens trabalharam 9 horas cada um, e assim temos 27 horas de trabalho desses homens. Conclui-se que, na cidade B, os 7 homens levaram 55 horas para descarregar as 227,5 toneladas. Assim, a produtividade da equipe de trabalho da cidade B pode ser determinada por B Trabalho 227,5TPR 4,14T / h Tempo 55h = = = , ou seja, 4,14 toneladas por hora. Chegando na cidade A, os caminhões tiveram os 35% das 350 toneladas (122,5 T restantes) descarregadas por 5 homens trabalhando 7 horas cada um, ou seja, foram 35 horas para descarregar essas 122,5 toneladas. Sua produtividade foi de A Trabalho 122,5TPR 3,5T / h Tempo 35h = = = , ou seja, 3,5 toneladas por hora. Fazendo a comparação entre as produtividades das equipes percebe-se que a equipe da cidade B foi mais produtiva, pois descarregou maior quantidade no mesmo tempo (em horas). UNIDADE 1 Tópico 4 Exercício Comentado 1. Para realizar um estudo sobre o tempo gasto, em minutos, por 60 elementos de um clube de karting num circuito de 20 voltas, registrou-se o tempo gasto por 16 desses elementos. Os resultados foram os seguintes: 14,1 13,5 15,0 16,2 17,6 18,7 13,1 15,4 16,6 17,2 14,8 15,9 18,0 16,3 14,9 14,3 a) Indique: qual a população e a amostra. b) Indique qual a variável estatística do estudo e classifique-a. Solução: a) A população estudada envolve os 60 elementos de um clube de karting, de ondo foi tirada uma amostra de 16 elementos. b) A variável estudada (medida) foi a quantidade de voltas dadas por minutos por cada elemento do clube. Essa variável é classificada como uma variável quantitativa contínua. UNIDADE 1 Tópico 4 Exercícios Comentado 2. Planeja-se um levantamento por amostragem para avaliar diversas características da população de estudantes da Instituição “A”. Estas características (parâmetros) são especialmente: idade média, renda per capita, local de origem, etc. Utilizando a tabela a seguir, com dados referentes a 2006, qual deve ser o tamanho mínimo de uma amostra aleatória simples, tal que, possamos admitir com alta confiança, que os erros amostrais não ultrapassem a 4%? Solução: Primeiramente devemos calcular o número de elementos da população, ou seja, o total de alunos da Instituição “A”. Para isto, basta somar o número de alunos de cada curso. Assim N = 3746 representa a população a ser estudada. Para determinar o tamanho da amostra devemos seguir as 4 etapas descritas no caderno. 1a Etapa: Cálculo da Amostra Ideal. Como o erro amostral não deve ultrapassar 4%, devemos usar E0 = 4% = 0,04. 0 2 2 0 1 1 1 n 625 0,0016(E ) (0,04)= = = = 2a Etapa: Cálculo da Amostra Mínima. Usando os valores da população e da amostra ideal calculamos o tamanho da amostra mínima: 0 0 N n 3746 625 2341250 n 536 N n 3746 625 4371 ⋅ ⋅ = = = = + + 3a Etapa: Cálculo do Estimador da Amostra. Nesta etapa usamos a regra de três simples para determinar o estimador da amostra: N 100% N 100 xN 100n n xn x 100n x N 100 536 53600 x 14,31 3746 3746 ↔ ⇒ = ⇒ = ↔ = ⋅ = = = E assim, o estimador da amostra é 14,31%. 4a Etapa: Aplicação do Estimador aos Estratos. Agora, multiplicamos o estimador por cada um dos estratos, ou melhor, do número de alunos de cada curso da instituição: Tabela 11: Matrículas dos cursos de graduação da Instituição A em 2006 Curso Alunos Amostra CEX 287 287 · 14,31% = 41 CON 266 266 · 14,31% = 38 DIR 555 555 · 14,31% = 79 FIN 245 245 · 14,31% = 35 INF 329 329 · 14,31% = 47 MDA 340 340 · 14,31% = 49 MKT 423 423 · 14,31% = 61 NEF 270 270 · 14,31% = 39 PEP 370 370 · 14,31% = 53 REH 357 357 · 14,31% = 51 REP 110 110 · 14,31% = 16 TUR 194 194 · 14,31% = 28 TOTAL 3746 537 UNIDADE 2 Tópico 1 Exercício Comentado 1. Os dados a seguir são referentes a vendas de ventiladores, durante três meses do ano, em uma grande rede de lojas. 19 10 9 15 12 19 11 10 12 14 12 16 10 13 12 15 11 12 12 13 14 11 12 12 14 15 14 12 15 12 12 12 14 15 11 14 14 15 13 12 14 6 16 14 12 12 15 15 14 11 14 14 12 11 15 12 15 17 11 14 12 13 11 14 12 11 14 10 11 13 11 10 13 13 14 13 14 11 11 11 9 17 18 13 12 16 10 12 9 9 De acordo com os dados apresentados na grade acima, faça o que se pede a seguir: a) Os dados apresentados são dados brutos. Organize-os em rol. b) Faça uma distribuição de freqüência simples. c) Organize uma distribuição de freqüência com intervalos de classes, obedecendo à regra de Sturges para determinar o número de classes. Solução: a) Para organizar um rol devemos colocamos os dados em ordem (nesse caso optamos por) crescente: 6 10 11 12 12 12 13 14 15 15 9 10 11 12 12 13 14 14 15 16 9 11 11 12 12 13 14 14 15 16 9 11 11 12 12 13 14 14 15 16 9 11 11 12 12 13 14 14 15 17 10 11 11 12 12 13 14 14 15 17 10 11 11 12 12 13 14 14 15 18 10 11 12 12 12 13 14 14 15 19 10 11 12 12 12 13 14 14 15 19 b) Para a Distribuição de Freqüência Simples contamos quantas vezes (quanto dias) cada valor (número de ventiladores vendidos) aparece no rol: i N º Ventiladores Vendidos Nº. dias 1 6 1 2 9 4 3 10 6 4 11 14 5 12 21 6 13 9 7 14 17 8 15 10 9 16 3 10 17 2 11 18 1 12 19 2 Σ - 90 c) Para fazer a Distribuição de Frequências por Classes devemos usar a Regra de Sturges para definir quantas classes terá a distribuição: i = 1 + 3,3 · log n i = 1 + 3,3 · log 90 i = 1 + 3,3 · 1,9542425 i = 1 + 6,449 i = 7,449 E assim, teremos 7 classes. Agora devemos definir o intervalo de cada classe, ou seja, o limite inferior e o limite superior de cada classe usando i AAh i = Para isso, necessitamos da amplitude amostral (AA = maior valor – menor valor da amostra = 19 – 6 = 13) eda quantidade de classes (i = 7). Assim, i 13h 1,85 7 = ≅ Arredondando o valor encontrado, temos um intervalo de dois ventiladores vendidos em cada classe. A Distribuição de Freqüência por Classes das vendas de ventiladores fica assim definida: i N º Ventiladores Vendidos Nº. dias 1 06 ├ 08 1 2 08 ├ 10 4 3 10 ├ 12 20 4 12 ├ 14 30 5 14 ├ 16 27 6 16 ├ 18 5 7 18 ├ 20 3 Σ - 90 UNIDADE 2 Tópico 3 Exercício Comentado 1. Calcule a média, a moda e a mediana do seguinte agrupamento em classes: Tabela 45: Usuários cadastrados na UNIMED por faixa etária – 2005 i Faixa Etária fi 1 39 ├ 50 400 2 50 ├ 61 500 3 61 ├ 72 550 4 72 ├ 83 625 5 83 ├ 94 200 Σ - 2275 FONTE: Dados Hipotéticos (Fictícios) Solução: Para determinar os valores solicitados devemos calcular os pontos médios das classes (xi) e as frequencias acumuladas (fai). Os pontos médios são obtidos fazendo o limite inferior da classe mais o limite superior, e dividindo esse resultado por 2. Na 1ª classe, por exemplo, temos 39 50 44,5 2 + = . As frequencias acumuladas são obtidas somando a frequencia da classe anterior com a frequencia da classe considerada. Por exemplo, na 1ª classe a frequencia acumulada é 400. Na 2ª classe, a frequencia acumulada é 900, calculada por 400 (da 1ª classe) + 500 (da 2ª classe). Na 3ª classe soma-se a esse valor a frequencia absoluta dessa classe, e assim, tem-se 900 + 550 = 1450. E assim por diante. Para adintar os calculos também é necessário determinar os produtos dos pontos médios pelas frequencias absolutas de cada classe. Na 1ª classe, faz-se 44,5 · 400 = 17800, por exemplo. i Faixa Etária fi xi fai xi · fi 1 39 ├ 50 400 44,5 400 17800 2 50 ├ 61 500 55,5 900 27750 3 61 ├ 72 550 66,5 1450 36575 4 72 ├ 83 625 77,5 2075 48437,5 5 83 ├ 94 200 88,5 2275 17700 Σ - 2275 - - 148262,5 Agora podemos determinar a média da distribuição, que é dada pela soma dos valores da coluna xi · fi, dividido pela soma das frequencias absolutas (fi). Assim: i i i x f 148262,5 x 65,17 2275f ⋅ = ≅ = ∑ ∑ Ou seja, a média de idade dos usuários da UNIMED é de, aproximadamente, 65 anos. Para a moda deve-se verificar qual a classe modal, ou seja, que apresenta a maior frequencia absoluta, no caso a 4ª classe (i = 4). Identifica-se o limite inferior da classe modal, dado por li = 72; Identifica-se a diferença entre a frequencia da classe modal e da classe anterior, dado por d1 = 625 – 550 = 75; Identifica-se a diferença entre a frequencia da classe modal e da classe posterior, dado por d2 = 625 – 200 = 425; Identifica-se o valor do intervalo da classe modal, dado por h = 83 – 72 = 11. E com esses valores, calculamos a moda através da fórmula 65,7365,172M 500 82572M 11 42575 7572M h dd dlM o o o i 21 1 io =+= += ⋅ + += ⋅ + += E assim, a moda da distribuição é de, aproximadamente 74 anos. Para a mediana deve-se verificar qual a classe contém a mediana da distribuição, calculando a metade da frequencia total da distribuição: if 2275 1137,5 2 2 = = ∑ Procurando na coluna de frequencias acumuladas o valor 1137,5 fica na 3ª classe da distribuição, ou seja, a classe que contém a mediana é i = 3. O cálculo da mediana é feito através da fórmula i i i i i f Fa (anterior) .h 2 Md l f − = + ∑ Para isso, Identifica-se qual o limite inferior da classe da mediana, dado por li = 61; Já foi calculado o valor da expressão i f 2 ∑ , dado por 1137,5; Identifica-se a frequencia acumulada na classe anterior, dada por fa2 = 900; Identifica-se a frequencia absoluta da classe da mediana, dada por f3 = 550; Identifica-se o intervalo da classe da mediana, que é o mesmo calculado anteriormente, h = 11. Substituindo esses valores na fórmula tem-se: [ ] 75,6575,461Md 550 5,261261Md 11 550 5,23761Md 11 550 9005,113761Md =+= += ⋅+= ⋅ − += Assim, a mediana da distribuição é de, aproximadamente, 66 anos, o que siginifica dizer que 50% dos usuários da UNIMED possuem idade superior a 66 anos. UNIDADE 3 Tópico 1 Exercício Comentado 1. Os tempos de reação de um indivíduo a determinados estímulos foram medidos por um psicólogo, com sendo: 0,53 – 0,46 – 0,50 – 0,49 – 0,52 – 0,44 – 0,55 segundos. Determinar o tempo médio e o desvio-padrão de reação do indivíduo a esses estímulos. Solução: a) Para determinar o tempo médio de reação somamos os valores medidos e dividimos pela quantidade de valores, ou seja, 0,53 0, 46 0,50 0, 49 0,52 0, 44 0,55 3, 49 x 0,50 7 7 + + + + + + = = ≅ Assim, a média dos tempos de reação foi de, aproximadamente, 0,50 segundos. b) Por tratar-se de apenas um indivíduo onde foram medidos todos os tempos de reação aos estimulos devemos calcular o Desvio Padrão Populacional, dado por ( )2i i i x x f f − ⋅ σ = ∑ ∑ Começamos calculando os desvios ( )2i ix x f− ⋅ , usando fi =1. ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) 2 2 1 1 2 2 2 2 2 2 3 3 2 2 4 4 2 2 5 5 2 2 6 6 2 2 7 7 x x f 0,53 0,50 1 0,0009 x x f 0, 46 0,50 1 0, 0016 x x f 0,50 0,50 1 0 x x f 0, 49 0,50 1 0, 0001 x x f 0,52 0,50 1 0, 0004 x x f 0, 44 0,50 1 0, 0036 x x f 0,55 0,50 1 0,0025 − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = − ⋅ = Somando os desvios temos 0,0091. E substituindo na fórmula: ( )2i i i x x f 0,0091 0,0013 0,036 7f − ⋅ σ = = = ≅ ∑ ∑ E assim, o devio-padrão é de 0,036 segundos, aproximadamente. APÊNDICE A Exercício Comentado 1. Considere o resultado de dois testes obtidos por um grupo de internautas: xi 11 14 19 19 22 28 30 31 34 37 yi 13 14 18 15 22 17 24 22 24 25 a) Calcular o coeficiente de correlação de Pearson entre os testes obtidos. b) Determinar a função de regressão linear. c) Estimar y para x = 50. Solução: Para calcular o que é solicitado deve-se organizar um quadro, conforme a seguir: n xi yi xi . yi xi2 yi2 1 11 13 143 121 169 2 14 14 196 196 196 3 19 18 342 361 324 4 19 15 285 361 225 5 22 22 484 484 484 6 28 17 476 784 289 7 30 24 720 900 576 8 31 22 682 961 484 9 34 24 816 1156 576 10 37 25 925 1369 625 ΣΣΣΣ 245 194 5069 6693 3948 a) Para determinar o coeficiente de correlação usamos ( ) ( ) ( ) ( ) ( ) i i i i 2 22 2 i i i i n x y x y r n x x n y y ⋅ − = − ⋅ − ∑ ∑ ∑ ∑ ∑ ∑ ∑ , e substituindo os valores calculados no quadro, temos: [ ] [ ] ( ) ( ) 2 2 10 5069 245 194 r 10 6693 245 10 3948 194 50690 47530 r 66930 60025 39480 37636 3160 r 6905 1844 3160 r 12732820 3160 r 0,8856 3568,3077 ⋅ − ⋅ = ⋅ − ⋅ ⋅ − − = − ⋅ − = ⋅ = ≅ ≅ Assim, o coeficiente de correlação de Pearson entre os dois testes é de 0,8856, aproximadamente. b) A regressão linear é dada pela função Y = aX + b onde i i i i 2 2 i i n x y x y a n x ( x ) − = − ∑ ∑ ∑ ∑ ∑ e b y ax= − Para o cálculo do coeficiente a substituimos os valores calculados no quadro anteiriormente na fórmula dada: 2 10 5069 245 194 a 10 6693 245 50690 47530 a 66930 60025 3160 a 6905 a 0, 4576 ⋅ − ⋅ = ⋅ − − = − = = Para o cálculo do coeficiente b precisamos determinar as médias de xi e yi: i 11 14 19 19 22 28 30 31 34 37 245 x 24,5 10 10 + + + + + + + + + = = = i 13 14 18 15 22 17 24 22 24 25194y 19, 4 10 10 + + + + + + + + + = = = Substituindo esses valores na fórmula, temos: b y ax b 19, 4 0, 4576 24,5 b 19, 4 11, 2112 b 8,1888 = − = − ⋅ = − = E assim, temos a função deregressão linear, dada por Y = 0,4576·X + 8,1888. c) Agora podemos estimar o valor de y para x= 50, substituindo na função de regressão linear � � � Y 0, 4576 X 8,1888 Y 0, 4576 50 8,1888 Y 22,88 8,1888 31, 0688 = ⋅ + = ⋅ + = + = E assim, para um X estimado igual a 50, temos que o valor de Y é aproximadamente, 31.
Compartilhar