Baixe o app para aproveitar ainda mais
Prévia do material em texto
3.11 - EXERCÍCIOS 1 – A média mínima para aprovação em determinada disciplina é 5,0. Se um estudante obtém as notas 7,5; 8,0; 6,0; 2,5; 2,0; 5,5; 4,0 nos trabalhos mensais da disciplina em questão, o aluno foi aprovado ou não? 2 – A seguir é dada a distribuição da quantidade de defeitos por microcomputador para uma amostra de 100 aparelhos: 0 1 2 3 4 5 15 28 20 14 10 7 Quantidade de defeitos por micro 6 Número de aparelhos 6 Determinar o número médio de defeitos por microcomputador. 3 – Calcular a média para cada uma das distribuições: 4 – Tem-se R$2000,00 disponíveis mensalmente para compra de determinado artigo que custou nos meses de junho, julho e agosto, respectivamente: R$100,00; R$200,00; e R$400,00. Qual foi o custo médio do artigo para este período? 5 – Uma urna contém 100 fichas. Dez apresentam o número 5, trinta apresentam o número 10, vinte apresentam o número 15 e quarenta apresentam o número 20. Determine a média aritmética dos números apresentados nas fichas. 6 – Um sorveteiro vendeu, nas quatro últimas semanas, 1500, 1300, 1100 e 1800 picolés. Qual foi a quantidade média vendida na semana? 7 – Um estudante realizou uma pesquisa sobre a remuneração semanal de auxiliares financeiros em empresas de transporte. Uma amostra formada por cinco empresas revelou os seguintes dados: $200,00; $250,00; $280,00; $320,00; $4200,00. Pede-se: a) calcule a média; b) uma remuneração igual a $330,00 pode ser considerada alta ou baixa? 23 8 – Calcule a mediana da seguinte amostra: {3; 4; 5; 7; 8; 10}. 9 – Os valores referentes a sinistros ocorridos e, posteriormente, pagos por uma seguradora no mês passado foram iguais a {$400,00; $1300,00; $700,00; $950,00; $8000,00}. Calcule a média e a mediana. O que pode ser dito em relação aos valores encontrados? 10 – A seguir estão apresentados os números de funcionários de empresas que prestam serviços de limpeza. Qual a mediana dos valores apresentados? Classes Fi 1 |- 11 9 11 |- 21 14 21 |- 31 35 31 |- 41 22 41 |- 51 11 Soma 91 11 – A tabela a seguir apresenta a distribuição das importações de uma empresa de plásticos. Pede-se calcular a moda, a média e a mediana. Volume importado Fi 50.000 |- 60.000 5 60.000 |- 70.000 10 70.000 |- 80.000 20 80.000 |- 90.000 10 90.000 |- 100.000 5 Soma 50 12 – Uma pesquisa com 36 funcionários da rede de lojas Preço Baixo Ltda. revelou os salários apresentados na tabela seguinte. Calcule a média, a mediana e a moda. 49 7 49 7 49 9 50 0 50 1 50 4 50 5 50 6 50 8 50 8 50 8 50 8 51 0 51 1 51 1 51 1 51 1 51 2 51 2 51 3 51 3 51 3 51 4 51 6 51 52 52 52 52 52 8 0 0 3 4 4 52 5 52 6 52 8 52 9 53 0 53 3 13 – Com base nos dados da tabela seguinte, calcule: a) média; b) mediana; c) 1ºquartil; d) 3º decil; e) 60º percentil; f) moda. Classes Fi 4 |- 6 4 6 |- 8 11 8 |- 10 15 10|- 12 5 Soma 35 24 4 – MEDIDAS DE DISPERSÃO São medidas estatísticas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média. Por exemplo, sejam as séries a): {20, 20, 20} e b): {0, 20, 40}, temos que as duas têm média igual (20), porém, a série a) não possui dispersão em torno da média, enquanto a série b) apresenta dispersão em torno da média. 4.1 – AMPLITUDE TOTAL É uma medida de dispersão dada pela diferença entre o maior e o menor valor da série. Sua utilização como medida de dispersão é limitada, pois, sendo uma medida que depende apenas dos valores externos, não capta possíveis variações entre esses limites. Amplitude total (R) para dados não agrupados: Ex.: para a série : {10, 12, 20, 22, 25, 33, 38}, R = 38-10 = 28. Amplitude total (R) para dados agrupados: Classe Fi 4 |- 9 8 9 |- 14 12 14 |- 19 17 19|- 24 3 Soma 40 R = Lmax – lmin = 24-4 = 20. 4.2 – VARIÂNCIA AMOSTRAL Como se deseja medir a dispersão dos dados em relação à média, é interessante analisar os desvios de cada valor (xi) em relação à média x, isto é: (xi – x). Se as diferenças forem baixas, teremos pouca dispersão. A variância é dada por: Para dados agrupados, a variância é: EXEMPLO: Calcular a variância para as medidas amostrais abaixo: 25 xi - x xi (xi - x) 2 3 7 2 1 8 n = 5 EXEMPLO 2: Calcular a variância: PMi Fi PMi . Fi (PMi - x) (PMi - x)2 10 1 10 20 3 60 30 4 120 40 3 120 50 4 200 - 15 510 - Classes (PMi - x)2 . Fi 5 |- 15 15 |- 25 25 |- 35 35 |- 45 45 |-| 55 Soma 26 4.3 – DESVIO PADRÃO AMOSTRAL O cálculo da variância é obtido pela soma dos quadrados dos desvios em relação à média. Assim é que, se a variável sob análise for medida em metros, a variância deverá ser expressa em m2. Ou seja, a variância é expressa pelo quadrado da unidade de medida da variável que está sendo estudada. Para melhor interpretar a dispersão de uma variável, calcula-se a raiz quadrada da variância, obtendo-se o desvio padrão que será expresso na unidade de medida original. Assim: S = √S2 4.4 – COEFICIENTE DE VARIAÇÃO Trata-se de uma medida relativa de dispersão. Enquanto a amplitude total (R), a variância (S2) e o desvio padrão (S) são medidas absolutas de dispersão, o coeficiente de variação (CV) mede a dispersão relativa. As medidas de dispersão relativa analisam a média e o desvio padrão de uma única vez, através do cálculo da razão existente entre ambos. A mais usual medida de dispersão relativa é o coeficiente de variação, representado pela razão entre o desvio padrão e a média aritmética. Assim: CV = S x 100 x EXEMPLO: Em uma empresa, o salário médio dos homens é de $4000,00, com desvio padrão de $1500,00, e o salário médio das mulheres é de $3000, com desvio padrão de $1200,00. A dispersão relativa dos salários é maior para quem? 27 4.5 - EXERCÍCIOS 1 – A produção de manteiga dos últimos seis meses do Laticínio Sabor do Leite Ltda. foi, em toneladas por mês: {11; 8; 4; 10; 9; 12}. Com base nos números apresentados, calcule: a) a média; b) a variância; c) o desvio padrão; d) a amplitude total; e) o coeficiente de variação. 2 – As vendas mensais em toneladas de uma fábrica de tecidos sãos: {1; 2; 2; 1; 1; 3; 1; 1; 1; 1}. Calcule a média, a variância, o desvio padrão, a amplitude total e o coeficiente de variação. 3 – A indústria de Queijos Mineiros Ltda. extraiu uma amostra composta por 20 produtos. Os pesos encontrados (em gramas) foram iguais a: {1040; 950; 1100; 980; 1100; 1010; 1010; 900; 1005; 1015; 1030; 910; 1010; 1015; 1030; 910; 1050; 930; 950; 910}. Calcule: a) a média; b) a variância; c) o desvio padrão; d) a amplitude total; e) o coeficiente de variação. 4 – Os dados a seguir apresentam a quantidade (em milhares) de passageiros transportados em diferentes épocas do ano por uma grande empresa de transporte urbano. Com base nos números apresentados, pede-se obter: a) a média; b) a variância; c) o desvio padrão; d) a amplitude total; e) o coeficiente de variação. Classes Fi 1,5 |- 4,5 5 4,5 |- 7,5 10 7,5 |- 10,5 12 10,5 |- 13,5 6 13,5 |-| 16,5 7 Soma 40 5 – Os dados apresentados referem-se às idades de usuários de uma lan house da cidade. Com base nos números fornecidos, pede-se encontrar: a) a média; b) a variância; c) o desvio padrão; d) a amplitude total; e) o coeficiente de variação. Classes Fi 5 |- 15 2 15 |- 25 7 25 |- 35 20 35 |- 45 5 45 |- 55 4 55 |- 65 2 Soma 40 6 – Um fabricante de caixas de papelão fabrica três tipos de caixas. Testa-se a resistência de cada caixa, tomando-se uma amostra de 100 caixas e determinando-se a pressão necessária para romper cada caixa. Os resultados dos testes são: 28 A B 150 200 40 50 Tipos de caixas C Pressão média de ruptura 300 Desvio padrão das pressões 60 a) Que tipo de caixa apresenta a menor variação absoluta na pressão de ruptura? b) Que tipo de caixa apresenta a maior variação relativa na pressão de ruptura? 7 – Os dados seguintes referem-se a uma pesquisa feita com sete clientes da Mercearia Ltda., escolhidos ao acaso. Calcule: a) a média; b) a variância; c) o desvio padrão; d) a amplitudetotal; e) o coeficiente de variação. Rend a 49 700 22 650 30 8000 31 350 74 650 49 840 31 420 Cliente Idade Despesa Média A 60 B 90 C 60 D 50 E 80 F 90 G 40 8 – Um pesquisador aborda 30 transeuntes ao acaso e pergunta-lhes a idade. O resultado é dado pela tabela: 35 26 39 25 39 22 42 40 30 22 21 40 16 32 39 21 28 39 18 37 23 14 27 44 30 32 21 15 26 43 a) Resumir as informações sob a forma de distribuição de frequência. b) Apresentar os dados na forma de um histograma. c) Calcular a média, o desvio padrão e o coeficiente de variação. 29 5 – MEDIDAS DE ASSIMETRIA E CURTOSE 5.1 - ASSIMETRIA Quando uma distribuição é simétrica, as medidas de média, mediana e moda coincidem. Porém, a assimetria torna-as diferentes e essa diferença é tanto maior quanto maior é a assimetria. Assim, em uma distribuição em forma de sino, temos: distribuição simétrica, a média e a moda coincidem; distribuição assimétrica à esquerda ou negativa, a média é menor que a moda; e assimétrica à direita ou positiva, a média é maior que a moda: Baseando-nos nessas relações entre a média e a moda, podemos empregá-las para determinar o tipo de assimetria. Assim. calculando o valor da diferença: x Mo − Se: x Mo − = 0 , assimetria nula ou distribuição simétrica. x Mo − < 0 , assimetria negativa ou à esquerda. x Mo − > 0 , assimetria positiva ou à direita. Ainda, tem-se o coeficiente de assimetria que é dado por: 3( ) x Md As s − = Se 0,15 1 < < As , a assimetria é considerada moderada; se As >1, a assimetria é forte; se As = 0 a distribuição é simétrica. 5.2 - CURTOSE Denominamos curtose o grau de achatamento de uma distribuição em relação a uma distribuição padrão, denominada curva normal. 30 Quando a distribuição apresenta uma curva de freqüência mais fechada que a normal (ou mais aguda em sua parte superior), ela recebe o nome de leptocúrtica. Quando a distribuição apresenta uma curva de freqüência mais aberta que a normal (ou mais achatada na sua parte superior), ela é chamada platicúrtica. A curva normal, que é a nossa base referencial, recebe o nome de mesocúrtica. O coeficiente percentílico da curtose é dado por: Q Q CP P − = − 3 1 90 10 2( ) Uma vez que C = 0, 263 para uma curva normal, temos a seguinte classificação: C = C < C > 5.3 - EXERCÍCIOS 0, 263, curva mesocúrtica; 0, 263, curva leptocúrtica; 0, 263, curva platicúrtica. 1 - Considere os seguintes resultados relativos a três distribuições de freqüência: Determine o tipo de assimetria de cada uma delas. 2 - Uma distribuição de freqüência apresenta as seguintes medidas: x Md s = = = 48,1, 47,9 e 2,12 . Calcule o coeficiente de assimetria. 3 - Em uma distribuição de freqüência foram encontradas as seguintes medidas: x Mo Md s = = = = 33,18, 27,50, 31,67 e 12, 45 . a) Classifique o tipo de assimetria; b) Calcule o coeficiente de assimetria. 4 - Considerando a distribuição de freqüência relativa aos pesos de 100 operários de uma fábrica, determine o grau de assimetria: 31 5 - Considere as seguintes medidas, relativas a três distribuições de freqüência: a) Calcule os respectivos graus de curtose. b) Classifique cada uma das distribuições. 6 - Determine o grau de curtose e classifique a distribuição em relação à curva normal: 32 6 – DISTRIBUIÇÃO NORMAL E BINOMIAL 6.1 - DISTRIBUIÇÃO DE PROBABILIDADE Consideremos a distribuição de freqüências relativa ao número de acidentes diários em um estacionamento: Em um dia, a probabilidade de: - não ocorrer acidentes é: 22 0,73 30 p = = - ocorrer um acidente é: 5 0,17 30 p = = - ocorrer dois acidentes é: 2 0,07 30 p = = - ocorrer 3 acidentes é: 1 0,03 30 p = = Podemos então escrever a tabela de distribuição de probabilidade: Analisando outro caso, se o espaço amostral relativo ao "lançamento simultâneo de duas moedas" é S = {(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co) } e se X representa "o número de caras" que aparecem, a cada ponto amostral podemos associar um número para X: 33 Assim, temos: E podemos escrever: Ao definir a distribuição de probabilidade, estabelecemos uma correspondência unívoca entre os valores da variável aleatória X e os valores da variável P. Esta correspondência define uma função; os valores xi (i = 1, 2, ... , n) formam o domínio da função e os valores pi (i = 1, 2, 3, ... , n), o seu conjunto imagem. Essa função é denominada de função probabilidade e define a distribuição de probabilidade da variável aleatória X. Pode ser representada por: () ( )i f x PX x = = . Desta forma, ao lançarmos um dado. a variável aleatória X, definida por "pontos de um dado", pode tomar os valores 1, 2, 3, ... , 6. Como a cada um destes valores está associada uma e uma só probabilidade de realização e ()1 ∑P xi = , fica definida uma função de probabilidade, da qual resulta a seguinte distribuição de probabilidade: 6.2 - DISTRIBUIÇÃO BINOMIAL Vamos, neste item, considerar experimentos que satisfaçam as seguintes condições: a. O experimento deve ser repetido, nas mesmas condições, um número finito de vezes (n). b. As provas repetidas devem ser independentes, isto é, o resultado de uma não deve afetar os resultados das sucessivas. 34 c. Em cada prova deve aparecer um dos dois possíveis resultados: sucesso e insucesso. d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade qq p (1) = − do insucesso manter-se-ão constantes. Resolveremos problemas do tipo: determinar a probabilidade de se obterem k sucessos em n tentativas. O experimento "obtenção de caras em cinco lançamentos sucessivos e independentes de uma moeda" satisfaz essas condições. Sabemos que, quando da realização de um experimento qualquer em uma única tentativa, se a probabilidade de realização de um evento (sucesso) é p, a probabilidade de não realização desse mesmo evento (insucesso) é 1− = p q . Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e independentes. A probabilidade de que um evento se realize k vezes nas provas é dada pela função: () ( ) k nk n f x PX k pq k− = = = na qual: PX k ( ) = é a probabilidade de que o evento se realize k vezes em n provas; p é a probabilidade de que o evento se realize em uma só prova - sucesso; q é a probabilidade de que o evento não se realize no decurso dessa prova - insucesso; n k é o coeficiente binomial de n sobre k, igual a ! n knk − . !( )! Essa função, denominada lei binomial, define a distribuição binomial. 6.2.1 - Exercícios 1 - Uma moeda é lançada 5 vezes seguidas e independentes. Calcule a probabilidade de serem obtidas 3 caras nessas 5 provas. 2 - Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A ganhar 4 jogos. 3 - Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de uma moeda. 4 - Jogando-se um dado três vezes, determine a probabilidade de se obter um múltiplo de 3 duas vezes. 5 - Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a probabilidade de o time A: a. ganhar dois ou três jogos; 35 b. ganhar pelo menos um jogo. 6 - A probabilidade de um atirador acertar o alvo é 2 3. Se ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros? 7 - Seis parafusos são escolhidos ao acaso da produção de certa máquina, que apresenta 10% de peças defeituosas. Qual a probabilidade de serem defeituosos dois deles? 6.3 - DISTRIBUIÇÃO NORMAL Entre as distribuições teóricas de variável aleatória contínua, uma das mais empregadas é a distribuição normal. Muitas das variáveis analisadas na pesquisa socioeconômica correspondem à distribuição normal ou dela se aproximam. O aspecto gráfico de uma distribuição normal é o da figura a seguir: Figura 1 - Representação gráfica da distribuição normal Para uma perfeita compreensão da distribuição normal, observe a figura anterior e procure visualizar as seguintes propriedades: 1ª) A variável aleatória X pode assumir todo e qualquer valor real. 2ª) A representação gráfica da distribuição normal é uma curva em formade sino, simétrica em torno da média ( x ), que recebe o nome de curva normal ou de Gauss. 3ª) A área total limitada pela curva e pelo eixo das abscissas é igual a 1, já que essa área corresponde à probabilidade de a variável aleatória X assumir qualquer valor real. 4ª) A curva normal é assintótica em relação ao eixo das abscissas, isto é, aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcançá-lo. 5ª) Como a curva é simétrica em torno de x , a probabilidade de ocorrer valor maior do que a média é igual à probabilidade de ocorrer valor menor do que a média, isto é, ambas as probabilidades são iguais a 0,5. Escrevemos: P(X > x ) = P(X < x ) = 0,5. 36 Quando temos em mãos uma variável aleatória com distribuição normal, nosso principal interesse é obter a probabilidade de essa variável aleatória assumir um valor em um determinado intervalo. Vejamos como proceder, por meio de um exemplo concreto. Seja X a variável aleatória que representa os diâmetros dos parafusos produzidos por certa máquina. Vamos supor que essa variável tenha distribuição normal com média x = 2 cm e desvio padrão s = 0,04 cm. Pode haver interesse em conhecer a probabilidade de um parafuso ter um diâmetro com valor entre 2 e 2,05 cm. É fácil notar que essa probabilidade, indicada por: P(2 < X < 2,05), corresponde à área hachurada na Figura a seguir: Figura 2 - Representação de probabilidade na curva normal Se X é uma variável aleatória com distribuição normal de média x e desvio-padrão s, então a variável: z s − = x x tem distribuição normal reduzida, isto é, tem distribuição normal de média 0 e desvio-padrão 1. As probabilidades associadas à distribuição normal padronizada são encontradas na Tabela 1. Esta é uma tabela de distribuição normal reduzida, que nos dá a probabilidade de Z tomar qualquer valor entre a média 0 e um dado valor z, isto é: P(0 < Z < z). Temos, então, que se X é uma variável aleatória com distribuição normal de média x e desvio padrão s, podemos escrever: P( x < X < x) = P(0 < Z < z) com z s − = x x 37 Tabela 1 - Área sob a curva normal reduzida de 0 a z. 38 Voltemos ao problema apresentado. Queremos calcular P(2 < X < 2,05). Para obter essa probabilidade, precisamos, em primeiro lugar, calcular o valor de z que corresponde a x = 2,05 (se x = 2 ⇒ z = 0, pois x = 2). Temos, então: z s − − = = = = x x assim: P(2 < X < 2,05) = P(0 < Z < 1,25) 2,05 2 0,05 1, 25 0,04 0,04 Procuremos, agora, na Tabela 1 o valor de z = 1,25. Na primeira coluna encontramos o valor 1,2. Em seguida, encontramos, na primeira linha, o valor 5, que corresponde ao último algarismo do número 1,25. Na intersecção da linha e coluna correspondentes encontramos o valor 0,3944, o que nos permite escrever: P(0 < Z < 1,25) = 0,3944 Assim. a probabilidade de um parafuso fabricado por essa máquina apresentar um diâmetro entre a média x = 2 e o valor x = 2,05 é 0,3944. Escrevemos. então: P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 = 39,44% 6.3.1 - Exercícios 1 - Determine as probabilidades e represente graficamente: a) P Z ( 1, 25 0) − << b) P Z ( 0,5 1, 48) − << c) P Z (0,8 1, 23) < < d) P Z( 0,6) > e) P Z( 0,92) < 39 2 - Os salários semanais dos operários industriais são distribuídos normalmente, em torno da média de R$ 500, com desvio padrão de R$ 40. Calcule a probabilidade de um operário ter um salário semanal situado entre R$ 490 e R$ 520. 3 - Sendo Z uma variável com distribuição normal reduzida, calcule: a. P(0 < Z < 1,44) b. P( −0,85 < Z < 0) c. P( −1,48 < Z < 2,05) d. P(0,72 < Z < 1,89) e. P(Z > −2,03) f. P(Z > 1,08) g. P(Z < −0,66) h. P(Z < 0,60) 4 - Um teste padronizado de escolaridade tem distribuição normal com média 100 e desvio padrão 10. Determine a probabilidade de um indivíduo submetido ao teste ter nota: a. maior que 120; b. maior que 80; c. entre 85 e 115; d. maior que 100. 5 - Os pesos de 600 estudantes são normalmente distribuídos com média 65,3 kg e desvio padrão 5,5 kg. Determine o número de estudantes que pesam: a. entre 60 e 70 kg; b. mais que 63,2 kg; c. menos que 68 kg. 6 - A duração de um certo componente eletrônico tem média de 850 dias e desvio padrão de 40 dias. Sabendo que a duração é normalmente distribuída, calcule a probabilidade de esse componente durar: a. entre 700 e 1.000 dias; b. mais de 800 dias; C. menos de 750 dias. 40 7 – AMOSTRAGEM A amostragem costuma ter o objetivo principal de permitir a síntese de informações acerca de um conjunto maior de dados, o universo ou população, por meio de uma parte, geralmente denominada amostra. As vantagens da amostragem consistiriam, geralmente, na redução de custos e tempos do estudo – uma análise de menor quantidade de elementos permite gastos menores, além de coleta e análise mais rápidas. Nos procedimentos da amostragem geralmente empregados em Estatística, um cuidado básico deve ser tomado. A amostra deve ser representativa da população. Com base nos dados de uma amostra representativa e empregando procedimentos estatísticos apropriados, é possível inferir ou generalizar as conclusões obtidas da amostra para a população. Os estudos estatísticos podem ser feitos de duas maneiras básicas: o censo – quando se estuda toda a população, como no caso do censo do Instituto Brasileiro de Geografia e Estatística – e a amostragem – quando se seleciona uma parte do todo para estudar. Quando se deseja generalizar os dados de uma amostra para o universo, deve-se observar uma condição básica e fundamental: a amostra deve ser representativa do universo. Para se definir o tamanho da amostra, para populações finitas utiliza-se a seguinte equação: ⋅ ⋅⋅− = −⋅ + ⋅⋅− NZ p p nN eZp p 2 (1 ) ( 1) (1 ) 2 2 onde: n é o tamanho da amostra; N é o tamanho do universo; Z é o valor tabulado correspondente ao nível de confiança (por exemplo: Z = 1,96, para um nível de confiança de 95%); e é a margem de erro máximo que eu quero admitir; e p é a proporção que esperamos encontrar, sendo considerada igual a 0,5 nos casos em que não temos nenhuma informação sobre o valor que esperamos encontrar. Quando trabalhamos com universos de tamanhos muito grandes (a partir de 100.000 indivíduos), considerados infinitos, podemos simplificar a equação anterior: ⋅⋅− = Zp p (1 ) 2 ne 2 Na Tabela 2 encontramos o tamanho das amostras. Nela estão descritos o tamanho do universo, o nível de confiança e o erro inferencial. Normalmente utiliza-se um nível de confiança de 95% e um erro inferencial de 5%. A situação para a utilização desta tabela ocorre quando se trabalha com variáveis qualitativas ordinais ou nominais, variáveis 41 quantitativas, e a população finita de tamanho conhecido. Esta é a situação da maioria dos estudos em Ciências Sociais, como a Administração. Tabela 2 - Tamanho da amostra. 42 Uma vez determinado o tamanho da amostra, o método de seleção probabilístico mais simples é aquele que utiliza a amostragem aleatória. A amostragem aleatória, ou amostragem aleatória simples, consiste em uma das principais maneiras de extrair uma amostra de qualquer população. Sendo representativa, deve objetivar o cumprimento da exigência básica de que cada elemento da população tenha as mesmas chances de ser escolhido para fazer parte da amostra. Para uma população finita, a amostragem aleatória pode ser obtida de duas formas. A primeira forma consiste basicamente na organização dos elementos da população em uma lista, sendo, posteriormente, utilizado um processo aleatório para escolha dos elementos que farão parte da amostra. A segunda forma de escolha é adequada para elementos que são difíceis de ser identificados, tornando-se impossível listar a população para então aplicar um processo para escolha dos itens que farão parte da amostra. Nestes casos, deve-se adequar um intervalo, uma medida como base, no lugar dos itens para se fazer uma avaliação. Para uma população finita muito grande, as formas de se obter uma amostra aleatória tornam-semais desafiadoras. Uma das soluções se dá por meio do processo probabilístico, em que se registram todos os casos na ordem em que eles vão aparecendo. É muito mais fácil obter amostras aleatórias a partir de populações finitas, em que os elementos podem ser contados e identificados. Por exemplo, imagine que um pesquisador necessitasse extrair uma amostra aleatória simples formada por cinco pessoas extraídas do universo de 28 alunos representado no quadro seguinte: Para selecionar aleatoriamente os alunos utiliza-se a Tabela de Números Aleatórios (Tabela 3) que nada mais é que os números {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} distribuídos de forma indistinta ou aleatória. 43 Tabela 3 - Tabela de Números Aleatórios. Como existem 28 alunos, devem ser lidos os números na tabela aleatória de dois em dois algarismos. Escolhendo de forma aleatória a segunda linha da tabela, os números sorteados seriam: 08 – 13 – 67 – 90 – 68 – 58 – 14 – 89 – 26 – 69 – 37 – 43 – 19 – 01 – 49 – 71 – 82 – 80. Como apenas os números compreendidos entre 00 e 27 estão listados no universo, somente os cinco primeiros valores sorteados entre estes intervalos poderiam ser selecionados. Seriam escolhidos, nesta sequência, os números: 08 – Mariana; 13 – Maria; 14 – Neila; 26 – Patrícia; e 19 – Ana. Além dos métodos probabilísticos de amostragem existem também os métodos não probabilísticos. Neste caso, não existe a manutenção ou tentativa de manutenção da representatividade. A amostragem não probabilística apresenta gastos menores e pode ser 44 executada em menos tempo. Em amostragens deste tipo, não é necessário utilizar uma lista com todos os elementos contidos na população. Dentre os principais métodos empregados para a seleção de amostras não probabilísticas, cita-se: • Amostragem acidental ou por conveniência: neste tipo de amostragem, os elementos da amostra são escolhidos por serem os mais acessíveis ou fáceis de ser estudados. • Amostragem por julgamento: neste processo, os elementos são selecionados para a amostra segundo o parecer de um especialista no assunto. Este julga aqueles mais apropriados para o estudo em questão. • Amostragem intencional ou proposital: o pesquisador escolhe propositalmente os elementos que farão parte da amostra. 7.1 - EXERCÍCIOS 1 – O que é amostra? Qual sua relação com população? 2 – Qual a diferença entre amostragem probabilística e amostragem não probabilística? 3 – Uma empresa de pesquisa eleitoral foi contratada por um partido político com o objetivo de investigar a preferência dos eleitores pelo candidato da situação na próxima eleição presidencial. Será utilizado um nível de confiança igual a 95% e um erro máximo igual a 4%. Calcule os tamanhos das amostras necessárias nos seguintes casos: Município Universo de eleitores Gigantópolis muito grande, considerado infinito Miracema 5000 Bela Morada 30000 4 – Uma empresa está realizando uma pesquisa de satisfação com seus funcionários. Para tanto, vai coletar uma amostra referente a 30% do total de funcionários. Sabendo-se que o seu setor possui 30 funcionários, quantos e quais serão os entrevistados? A tabela a seguir apresenta o nome dos funcionários do seu setor. Utilize a Tabela de Números Aleatórios. 45 8 – CORRELAÇÃO E REGRESSÃO LINEAR A análise de regressão e correlação tem como objetivo estimar numericamente o grau de relação que possa ser identificado entre populações de duas ou mais variáveis, a partir da determinação obtida com base em amostras selecionadas destas populações focalizadas. Como exemplo considere o exemplo de uma rede de lojas de confecções que coletou uma amostra de dados passados referentes a seus gastos com publicidade ($mil) e seu volume de vendas ($mil). Vendas versus gastos com publicidade de loja de confecções Gastos com Publicidade ($mil) 3 4 8 12 14 Vendas ($mil) 7 14 15 28 32 35 30 25 s a d n e V 20 15 10 5 0 0 2 4 6 8 10 12 14 16 Gastos com publicidade 8.1 – REGRESSÃO LINEAR SIMPLES A análise de regressão linear simples tem por objetivo obter a equação matemática da reta que representa o melhor relacionamento numérico linear entre o conjunto de pares de dados em amostras selecionadas, dos dois conjuntos de variáveis. A equação da reta obtida pode ser apresentada como: y = a + b.x , sendo y a variável dependente (explicada) e x a variável independente (explicativa). Para se definir os termos a e b da equação, usa-se as seguintes funções: Veja o exemplo que relaciona os gastos em publicidade com as vendas, anteriormente apresentado: 46 Gastos com Publicidade ($mil) Vendas ($mil) x2 y2 xy 3 7 9 49 21 4 14 16 196 56 8 15 64 225 120 12 28 144 784 336 14 32 196 1024 448 ∑x = 41 ∑y = 96 ∑x2 = 429 ∑y2 = 2278 ∑xy = 981 Aplicando-se as fórmulas: Com base nos valores obtidos para a e b, é possível determinar que a reta que melhor ajusta os pontos é: y = 2,0754 + 2,0884x. Com essa função pode-se fazer previsões das vendas em relação à quantia que pretende-se investir em publicidade. 35 s a d n e V y = 2,074 + 2,0884x 30 25 20 15 10 5 0 0 2 4 6 8 10 12 14 16 Gastos com publicidade 8.2 - CORRELAÇÃO A análise de correlação determina um número que expressa uma medida numérica do grau da relação encontrada entre duas variáveis. Seu sinal pode ser positivo ou negativo e sua faixa de variação está compreendida entre -1 e 1. O coeficiente de correlação indica o grau da 47 relação numérica linear obtida, ou o grau de ajuste de uma reta ao conjunto dos pontos da amostra. O coeficiente de correlação (r) pode ser calculado pela seguinte equação: Aplicando ao exemplo anterior, teremos: A partir do r pode-se calcular o coeficiente de determinação, ou simplesmente r2, que além de expressar o quadrado do coeficiente de correlação, representa a relação entre a variação explicada pelo modelo e a variação total. Para os dados apresentados anteriormente, temos: r2 = 0,9648 x 0,9648 = 0,9308. De modo geral, para valores de r2 iguais ou superiores a 0,60, diz-se que o ajuste linear apresenta uma boa qualidade. 8.3 – EXERCÍCIOS 1 – A Lojas Barateiras possui cinco lojas, situadas nos estados de São Paulo, Rio de Janeiro, Minas Gerais, Rio Grande do Sul e Santa Catarina. Alguns dados da loja estão apresentados na tabela seguinte: SP RJ MG RS 18 12 10 16 16 11 10 14 Loja SC Número de vendedores 13 Vendas (em $ mil) 12 A empresa acredita que o volume de vendas seja uma função linear do número de vendedores de cada loja. Pede-se construir um modelo de ajuste linear. Utilizando o modelo encontrado, qual seria a previsão de vendas para 19, 20 e 21 vendedores? 2 – Um professor resolveu analisar as notas de uma amostra formada por oito alunos. Os dados coletados estão apresentados na tabela seguinte. Pede-se: a) construa um modelo de ajuste linear entre os pontos; b) calcule o coeficiente de determinação e comente a qualidade do ajuste; c) calcule a nota esperada na prova para um aluno que obteve nota seis no teste. 48 Teste 7 5 10 3 8 9 7 5 Prova 10 7 10 5 12 10 10 6 3 – Uma empresa resolveu comparar o número de horas de treinamento preventivo com o número de acidentes verificados nas suas instalações. Obteve os números apresentados na tabela seguinte. Pede-se: a) construa um modelo de ajuste linear entre os pontos; b) calcule o coeficiente de determinação e comente a qualidade do ajuste. Treinament o 14 12 18 25 32 44 17 28 Acidentes 49 52 45 46 41 35 49 44 4 – Uma empresa está estudando como varia a demanda de certo produto em função do seu preço de venda. Para isso levantou as seguintes informações: Mês Unidades Vendidas (y) Preços de vendas (x) por unidade Jan. 250 R$ 163,00 Fev. 275 R$ 159,00 Mar. 300 R$ 175,00 Abr. 225 R$ 180,00 Maio 247 R$ 165,00 Com base nestes dados, mostrar que a demanda do produto decresce linearmente com o acréscimo de preço. 5 – Uma rede de lojas de departamento suspeitava que em duas das suas oito filiais poderiam estar ocorrendo fraudes, com o desvioirregular de faturamento. A direção acreditava que as vendas das lojas poderiam ser explicadas, fundamentalmente, pelo seu tamanho. Os principais dados das lojas estão apresentados na tabela seguinte: Loja Tamanho em m2 Vendas em $ 1 1200 85000,00 2 800 71000,00 3 600 71000,00 4 450 65000,00 5 900 75500,00 6 950 75600,00 7 750 73250,00 8 500 69500,00 Com base nos dados anteriores e na aplicação das técnicas de regressão e correlação, estime em quais lojas podem estar acontecendo problemas. 6 – Uma empresa de itens de borracha apresenta, na tabela abaixo, a produção e os custos associados a cada mês de produção. Analisou-se esses dados utilizando uma série histórica dos custos relacionados à produção de um único produto, ocorridos no ano de 2002. Com base nos dados apresentados pede-se: a) construa um modelo de ajuste linear entre os pontos; 49 b) calcule o coeficiente de determinação; faça a projeção dos custos utilizando os mesmos dados de produção do ano 2002 com o modelo construído. Mês Produção Custo Total Jan 1750 R$ 50.230,00 Fev 1900 R$ 50.500,00 Mar 2220 R$ 58.320,00 Abr 2220 R$ 58.320,00 Mai 3000 R$ 62.710,00 Jun 3000 R$ 62.710,00 Jul 3000 R$ 62.710,00 Ago 2000 R$ 56.900,00 Set 1950 R$ 50.600,00 Out 1000 R$ 48.010,00 Nov 660 R$ 37.000,00 Dez 600 R$ 37.000,00 50 REFERÊNCIAS BRUNI, A. L. Estatística Aplicada à Gestão Empresarial. 2.ed. São Paulo: Atlas, 2010. CRESPO, A. A. Estatística Fácil. 18 ed. São Paulo: Saraiva, 2002. COSTA, S. F. Introdução Ilustrada à Estatística. 3. ed. São Paulo: Harbra, 1998. MARTINS, G. A. Estatística Geral e Aplicada. 3. ed. São Paulo: Atlas, 2010.
Compartilhar