Baixe o app para aproveitar ainda mais
Prévia do material em texto
EA D Teoria da Amostragem 3 1. OBJETIVO • Conhecer a teoria da amostragem, identificando o erro amostral, a fim de compreen- der seus métodos e aplicá-los. 2. CONTEÚDOS • Teoria da amostragem. • Métodos de amostragem. • Erro amostral. 3. ORIENTAÇÕES PARA O ESTUDO DA UNIDADE Antes de iniciar o estudo desta unidade, é importante que você leia as orientações a se- guir: 1) Reflita sobre alguns conceitos introdutórios importantes, dando atenção especial àqueles referentes à notação e aos vistos em Estatística. 2) Utilize a padronização (cálculo da variável Z) e a tabela da distribuição normal padro- nizada (vista na Unidade 2), a fim de aplicar os conceitos de probabilidade em uma variável aleatória. 4. INTRODUÇÃO À UNIDADE Em razão da dificuldade em pesquisar a totalidade dos dados, na prática utilizamos amos- tras para representar os dados de interesse. A amostra deve ser representativa da população de 64 © Estatística Aplicada origem e permitir que façamos uma generalização dos dados amostrais para os dados popula- cionais. No estudo das variáveis quantitativas, os dados são representados pela média e pelo des- vio padrão. Já no estudo das variáveis qualitativas (não numéricas), os dados são expressos por meio de proporções e/ou porcentagens. Mais uma vez, adotaremos letras do alfabeto grego para fazer referência a dados popula- cionais ou probabilísticos. Nesta unidade, utilizaremos a letra mu (µ ) para representar a média da distribuição, a letra sigma (σ ) para o desvio padrão e a letra teta (θ ) para uma proporção populacional. Um exemplo de estudo por amostragem pode ser visto nas pesquisas de opinião pública, efetuadas por profissionais da área que fazem previsões razoavelmente precisas de resultados, como os das eleições, na qual são pesquisadas poucas centenas de eleitores. Dessa forma, a simplicidade que oferece a técnica de amostra também nos leva a atentar sobre o cuidado que devemos ter com as formas de coleta de dados, pois uma coleta indevida pode resultar no insucesso de toda uma pesquisa. 5. MÉTODOS DE AMOSTRAGEM O pesquisador utiliza os métodos científicos mais adequados, verificando se os elementos da amostra são suficientemente representativos de toda a população, de forma a generalizá-la. Cada elemento da população tem a mesma chance de qualquer outro de fazer parte da amostra, denominando-se método de amostragem aleatório ou amostragem probabilística. O uso de amostragem probabilística permite a generalização dos resultados amostrais para a população, adotando-se medidas probabilísticas para o dimensionamento do erro amostral. No entanto, por questões de conveniência e falta de interesse em estabelecer resultados populacionais, em alguns casos são utilizadas amostragens não aleatórias ou não probabilísticas. Amostras não aleatórias Amostras não aleatórias representam o método mais comum, com base, exclusivamente, no que é conveniente para o pesquisador, isto é, o pesquisador escolhe os casos para aplicá-los em sua amostra. Conclui-se que, na aplicação desse método, devemos ter cuidado com a carac- terização não científica, uma vez que os resultados podem ser direcionados a fim de que estes sejam mais convenientes. Um exemplo de amostra não aleatória é a amostragem por cotas e por conveniência, na qual pesquisamos algumas características de populações, tais como sexo, classe social, idade, etnia etc., para serem submetidas ao processo de amostragem, na mesma proporção em que se dão na população. Para compor a amostra, solicitaremos aos entrevistadores que pesquisem uma população em que 38% são mulheres e 62% são homens. Dessa forma, se a população é composta de 450 indivíduos, selecionaremos 171 mulheres e 279 homens para a amostra. Neste caso, a escolha é feita sem nenhum critério científico, o que pode tendenciar a amostragem e invalidar os re- sultados. Outro tipo de amostra não aleatória é a amostragem por julgamento. Nesse tipo de amos- tragem, utilizamos o bom senso, a lógica ou um julgamento bem fundamentado para selecionar Claretiano - Centro Universitário 65© U3 - Teoria da Amostragem uma amostra que seja representativa da população a ser estudada. Um exemplo seria utilizar os leitores de uma determinada revista direcionada para a classe média alta a fim de representar essa classe social especificamente. Amostras aleatórias Nas amostras aleatórias, identificamos todos os indivíduos da população, de modo que tenham a mesma chance de serem escolhidos para compor a amostra ou que haja uma proba- bilidade conhecida de serem selecionados. Dessa forma, fica patente que a amostra representa a população, não caracterizando manipulação dos resultados. Entretanto, com esse tipo de coleta podemos identificar problemas. Por exemplo, imagine uma lista completa de todos os alunos matriculados em uma grande universidade, ou a relação de todos os moradores de uma grande cidade. Como teremos certeza de que todos os indivídu- os da população estão na lista? Em razão de dificuldades dessa natureza, existem diversas formas de se obter uma amos- tra aleatória, de acordo com os objetivos da coleta de dados e das características da população. Um tipo básico de amostra aleatória muito utilizado é a técnica de amostragem aleatória simples, que pode ser facilmente obtida. Por exemplo, quando se anotam os nomes de pesso- as em pequenos pedaços de papel, colocando-os em uma caixa, um chapéu (grande) ou outro recipiente. O uso de uma tabela de números aleatórios é bastante útil para os pesquisadores que necessitam de uma amostra aleatória, conforme demonstrado no Quadro 1. Quadro 1 Números aleatórios. 1 2 3 4 5 6 7 8 9 10 11 12 1 2 4 5 8 7 0 2 4 9 0 6 7 2 5 4 3 0 9 4 8 3 4 9 2 7 3 5 2 4 9 3 5 7 1 5 6 8 1 4 2 5 4 3 0 1 9 5 6 7 2 4 5 3 3 5 4 1 4 2 1 4 5 6 3 6 9 6 4 5 8 3 5 5 4 6 8 7 NÚMERO DA COLUNA N ú m er o d a li n h a A tabela de números aleatórios possibilita selecionar uma amostra representativa equi- valente à obtida pelo processo de tiras de papel colocadas em um recipiente. Veja, a seguir, um exemplo de aplicação desse método. Exemplo Utilizando o Quadro 1, vamos selecionar uma amostra de 60 indivíduos em uma popula- ção de 600 alunos (matriculados no Curso de Estatística do Ceuclar). Inicialmente, vamos atribuir números de 001 a 600 para todos os alunos do Curso de Es- tatística. Aleatoriamente, o pesquisador irá escolher na tabela um início para a coleta de dados, por exemplo a intersecção da linha 5 com a coluna 1, caminhando da esquerda para a direita, a fim de selecionar os números entre 001 e 600. Os primeiros números que aparecem na coluna 1 e linha 5 são 3, 3 e 5. Portanto, o primei- ro aluno a ser escolhido é o de número 335. Em seguida, visualizamos os números 4, 1 e 4. Logo, 66 © Estatística Aplicada o segundo aluno selecionado é o de número 414, e assim devemos repetir o processo até que tenhamos 60 indivíduos dessa população de 600 (alunos). O procedimento de amostras aleatórias simples é a base para a definição de diversos tipos de amostragens probabilísticas. Uma das mais comuns é a amostragem aleatória estratificada, que deve ser utilizada quando a informação de interesse na população se relaciona com suas características. Por exemplo, ao realizar uma pesquisa de mercado com consumidores de uma população, para verificar a aceitação de uma novo modelo de aparelho celular, devemos considerar que a aceitação pode ser influenciada pelo gênero do consumidor, pela sua renda, pela sua profissão etc. Assim, ao selecionarmos, aleatoriamente, os consumidores, devemos manter uma pro- porcionalidade dentro de cada característica (estrato), a fim de garantir a representatividade. O processo de seleção ou sorteio é facilitado pelo trabalho com esses estratos. Note que a diferença entre uma amostra estratificada (probabilística) e uma amostra por cotas (não probabilística) está na forma de seleção dos indivíduos. Uma outra maneira de selecionar aleatoriamenteos indivíduos da população é adotar a amostra aleatória sistemática. Esta é útil quando os indivíduos da população são definidos com base em listas (por exemplo: lista telefônica, cadastro de clientes ou fornecedores, lista de en- dereços de e-mail etc.). Com base em uma lista, podemos, em vez de proceder a um sorteio completo, subdividir a lista em listas menores, e sortear apenas um indivíduo de cada lista, sistematizando o resultado para as demais. Por exemplo: suponhamos que a lista da população contenha 10.000 indivíduos e necessi- temos sortear 500. Dividindo 10.000 por 500, obtemos 20. Então, é possível imaginar 500 listas com 20 indivíduos cada uma. Assim, sorteamos um número de 1 a 20, por exemplo, o número 12. Dessa forma, escolhemos o 12º elemento de cada uma das 500 listas. Com certeza, é bem mais simples do que sortear diretamente dos 10.000. Independentemente do método, nos três casos citados, devemos proceder à escolha ale- atória (sorteio) dos indivíduos, o que pode, em alguns casos, ser trabalhoso. Para minimizar o trabalho, podemos utilizar uma amostragem por conglomerados. Tal amostragem é útil quando estudamos uma população que pode ser subdividida geo- graficamente ou segundo algum critério de localidade. Assim, em vez de sortearmos indivíduos, faremos o sorteio das localidades. Esse tipo de amostragem é muito comum em pesquisas elei- torais e pesquisas de mercado. 6. ERRO AMOSTRAL Definiremos algumas notações para a continuidade de nossos estudos, uma vez que apa- recem a média de uma amostra, a média de uma população ou mesmo a média do desvio pa- drão, bem como proporções, quando trabalhamos com dados qualitativos. Observe, no Quadro 2 a seguir, alguns símbolos. Claretiano - Centro Universitário 67© U3 - Teoria da Amostragem Quadro 2 Símbolos. Média Amostra X População µ Desvio Padrão Amostra S População σ Proporção Amostra p População θ Assim, vamos utilizar os símbolos µ , σ e θ para populações e distribuições de probabi- lidades amostrais. Um pesquisador necessita obter uma amostra que seja representativa da população estu- dada e, por mais que os métodos de coleta sejam padronizados, uma média amostral X quase nunca será igual à média populacional µ , e um desvio padrão S dificilmente será igual ao desvio padrão populacional σ . Essa diferença entre os valores é conhecida como erro amostral. Para demonstrar a aplicação prática do erro amostral, citamos as pesquisas eleitorais. Uma vez que os pesquisadores fazem generalizações de uma amostra relativamente pequena para uma população numerosa de eleitores, eles costumam estipular uma margem de erro aci- ma e abaixo do índice divulgado. Por exemplo, o candidato A tem 72% de intenção de votos, com uma margem de erro de 4%. Essa situação indica que o candidato pode receber entre 68% e 76% dos votos, ou seja, 72% - 4%, e 72% + 4%. A seguir, acompanhe um exemplo prático de erro amostral. Exemplo Considere uma pesquisa realizada com uma população de 20 notas de um exame final e 3 amostras: A, B e C. Quadro 3 Uma população e 3 amostras aleatórias de notas de um exame final. POPULAÇÃO AMOSTRA A AMOSTRA B AMOSTRA C 70 80 93 96 40 72 86 85 90 99 86 96 56 52 67 56 56 49 40 78 57 52 67 56 89 49 48 99 72 30 96 94 µ = 71,55 X = 75,75 X = 62,25 X = 68,25 Fonte: Levin e Fox (2004, p. 184). 68 © Estatística Aplicada No Quadro 3, você pode observar a operação de um erro amostral. Ela mostra a população de 20 notas de um exame final e 3 amostras: A, B e C, extraídas aleatoriamente dessa população (cada uma extraída com o auxílio de uma tabela de números aleatórios). Nessa tabela, são nítidas as diferenças entre as médias amostrais. Além disso, nenhuma delas é igual à média da população ( 71,55µ = ). O mesmo raciocínio vale para quando estivermos trabalhando com variáveis qualitativas e calculando proporções ou porcentagens. Uma porcentagem amostral sempre estará sujeita a erro em relação à real porcentagem populacional, como, por exemplo, nas pesquisas eleitorais, a porcentagem de votos de um candidato obtida pela pesquisa não será necessariamente igual à porcentagem de votos que ele realmente apresenta em todo o eleitorado. 7. DISTRIBUIÇÕES DE PROBABILIDADE AMOSTRAL DA MÉDIA Verificamos que é natural o resultado obtido em uma particular amostra aleatória ser diferente do verdadeiro valor populacional, ou seja, é natural que a média amostral X seja diferente da média amostral µ , por exemplo. Assim, é importante estabelecer probabilidades sobre os resultados amostrais, daí a formação das distribuições de probabilidades amostrais. Utilizando a mesma lógica do exemplo anterior, suponhamos uma população com 6 indi- víduos (N 6= ), da forma {2, 4, 6, 8, 10, 12}, cuja média 7µ = . Consideremos agora todas as possíveis amostras com 2n = indivíduos dessa população e suas respectivas médias amostrais: Amostra 1: {2, 4}, com X = 3 Amostra 9: {4, 12}, com X = 8 Amostra 2: {2, 6}, com X = 4 Amostra 10: {6, 8}, com X = 7 Amostra 3: {2, 8}, com X = 5 Amostra 11: {6, 10}, com X = 8 Amostra 4: {2, 10}, com X = 6 Amostra 12: {6, 12}, com X = 9 Amostra 5: {2, 12}, com X = 7 Amostra 13: {8, 10}, com X = 9 Amostra 6: {4, 6}, com X = 5 Amostra 14: {8, 12}, com X = 10 Amostra 7: {4, 8}, com X = 6 Amostra 15: {10, 12}, com X = 11 Amostra 8: {4, 10}, com X = 7 Então, considerando todas as possíveis médias amostrais, chegamos a uma distribuição com a seguinte configuração: VALOR DA MÉDIA AMOSTRAL X FREQUÊNCIA 3 1 4 1 5 2 6 2 7 3 8 2 9 2 Claretiano - Centro Universitário 69© U3 - Teoria da Amostragem VALOR DA MÉDIA AMOSTRAL X FREQUÊNCIA 10 1 11 1 Note que a distribuição das médias amostrais é simétrica (média = mediana = moda = 7) e, então, podemos admitir que essa distribuição segue uma normal. Ainda, perceba que a média das médias amostrais é exatamente igual à média populacio- nal. Esse resultado é descrito no Teorema do Limite Central e garante a distribuição normal para a média amostral. Dada uma variável aleatória X, com média populacional µ e desvio padrão populacional σ , retirando-se uma amostra aleatória de tamanho n ( 30n ≥ ) desta população, a média amos- tral x será uma variável aleatória normalmente distribuída, com média igual à média popula- cional (µ ) e desvio padrão proporcional ao desvio padrão da população n σ . Assim, de maneira similar ao ocorrido com uma variável X, podemos determinar uma fórmula de padronização para x , e assim calcular probabilidades com a tabela da normal pa- dronizada (ver Unidade 2), como a seguir : Z = x n −µ σ Vamos exercitar a aplicação dessa fórmula, muito similar à dos exemplos que apresenta- mos na Unidade 2. Exemplo 1 Recentemente uma pesquisa foi divulgada, com base nos dados do censo do IBGE, tratan- do da distribuição de renda no país. Uma empresa que está se instalando na região, preocupada com o cenário descrito pela pesquisa, resolveu elaborar uma pesquisa de mercado para avaliar a renda média da região, dimensionando, assim, a possibilidade de comercialização de seus produtos. Para a pesquisa, a referida empresa avaliou um total de 300 chefes de famílias. Conside- rando que os dados censitários do IBGE para a região apontam para uma média populacional µ igual a R$ 688,89 e um desvio padrão populacional σ igual a R$ 514,88, determine: 1) Qual a probabilidade de a média da amostra x com 300 chefes, utilizada na pesquisa de mercado, resultar em um valor maior do que R$ 780,00? Dados do problema: a variável em questão é a renda, que denotaremos por X, cuja média 688,89µ = e desvio padrão 514,88σ = . A amostra a ser utilizada possui n = 300 elementos. Inicialmente, queremos calcular P(X 780)> . Padronizando o valor, temos: X 780 688,89 91,11 91,11 3,06514,88 514,88 29,73 17,32300 Z n µ σ − − = = = = = 70 © Estatística Aplicada Como para x também utilizamos a normal, graficamente, conforme representado na Figura 1,temos: Figura 1 Curva 1. Pela tabela da normal padronizada, a probabilidade entre 0 e 3,06 é 0,498893 ou 49,8893%. Assim, a P(X 780) 50% 49,8893% 0,1107%> = − = , ou seja, a probabilidade de que a renda média da amostra pesquisada seja maior do que R$ 780,00 é de 0,11%. 1) Qual a probabilidade de a média da amostra com 300 chefes resultar em oscilação entre R$ 650,00 e R$ 700,00? Inicialmente, queremos calcular P(650 700)x< < . Padronizando os valores, temos: X 650 688,89 38,89 38,89Z 1,31514,88 514,88 29,73 17,32300n µ σ − − = = = − = − = − X 700 688,89 11,11 11,11Z 0,37514,88 514,88 29,73 17,32300n µ σ − − = = = = = Graficamente, segundo podemos ver na Figura 2, temos: Figura 2 Curva 2. Claretiano - Centro Universitário 71© U3 - Teoria da Amostragem Pela tabela da normal padronizada, a probabilidade entre 0 e 1,31 é 0,404902 ou 40,4902%, e a probabilidade entre 0 e 0,37 é 0,144309 ou 14,4309%. Assim: P(650 700) 40,4902% 14,4309% 54,9211%x< < = + = Ou seja, a probabilidade de que a renda média da amostra pesquisada esteja entre R$ 650,00 e R$ 700,00 é de 55%. 2) Suponha que, após a pesquisa com os 300 chefes, tenha sido encontrada uma média amostral igual a R$ 796,77. Considerando o resultado obtido no item 1, qual a análise que podemos fazer sobre a amostra utilizada? No item 1, verificamos que a probabilidade de uma amostra com 300 chefes fornecer uma média amostral superior a R$ 780,00 é igual a 0,11%, ou seja, uma probabilidade muito peque- na, significando que esse resultado não é esperado. Então, se a pesquisa indicar uma média de R$ 796,77 (maior do que R$ 780,00), significa que a amostra coletada está gerando uma média pouco provável de ocorrer na prática, sendo pouco representativa e resultante de valores extre- mos na amostra. Note que, com base na probabilidade, podemos averiguar a pertinência ou não das amos- tras, o que é importante para a Estatística. 3) Refaça os cálculos do item 1, supondo que a amostra seja composta por 600 chefes de famílias. Compare e analise os resultados. Dados do problema: a variável em questão é a renda, que denotaremos por X, cuja média 688,89µ = e desvio padrão 514,88σ = . A amostra a ser utilizada possui 600n = elementos. Vamos calcular novamente P(X 780)> . Padronizando o valor, temos: X 780 688,89 91,11 91,11Z 4,33514,88 514,88 21,02 24,49600n µ σ − − = = = = = Graficamente, conforme representado na Figura 3, temos: Figura 3 Curva 3. Pela tabela da normal padronizada, a probabilidade entre 0 e 4,33 é 0,499999 ou 49,9999%. Assim, a ( )P X 780 50% 49,9999% 0,0001%> = − = , ou seja, a probabilidade de que a renda média da amostra pesquisada seja maior do que R$ 780,00 é de 0,0001%. 72 © Estatística Aplicada Observe que, ao aumentarmos o tamanho da amostra (de 300 para 600), a probabilidade de ocorrer uma média extrema diminui, ou seja, a chance de a amostra ser não representativa reduz-se, já que, quanto maior a amostra, mais próximos ficamos da população e, assim, a chan- ce de errarmos diminui. 4) Refaça os cálculos do item 2, supondo que a amostra seja composta por 600 chefes de famílias. Compare e analise os resultados. Vamos calcular novamente ( )P 650 X 700< < , com 600n = elementos. Padronizando os valores, temos: X 650 688,89 38,89 38,89Z 1,85514,88 514,88 21,02 24,49600n µ σ − − = = = − = − = − X 700 688,89 11,11 11,11Z 0,53514,88 514,88 21,02 24,49600n µ σ − − = = = = = Graficamente, como se pode ver na Figura 4, temos: Figura 4 Curva 4. Pela tabela da normal padronizada, a probabilidade entre 0 e 1,85 é 0,467843 ou 46,7843%, e a probabilidade entre 0 e 0,53 é 0,201944 ou 20,1944%. Assim: P(650 X 700) 46,78343% 20,1944% 66,9787%< < = + = Ou seja, a probabilidade de que a renda média da amostra pesquisada esteja entre R$ 650,00 e R$ 700,00 é de 67%. Observe que, ao aumentarmos o tamanho da amostra (de 300 para 600), a probabilidade de ocorrer uma média amostral em torno da média da população aumenta, ou seja, a chance de a amostra ser representativa eleva-se, já que, quanto maior a amostra, mais próximos ficamos da população, e assim a chance de acerto aumenta. 5) Refaça os cálculos do item 1, supondo que o desvio padrão populacional seja igual a R$ 133,54. Compare e analise os resultados. Claretiano - Centro Universitário 73© U3 - Teoria da Amostragem Dados do problema: a variável em questão é a renda, que denotaremos por X, cuja média 688,89µ = e desvio padrão 133,54σ = . A amostra a ser utilizada possui 300n = elementos. Vamos calcular novamente ( )X 780Ρ > . Padronizando o valor, temos: X 780 688,89 91,11 91,11Z 11,82133,54 133,54 7,71 17,32300n µ σ − − = = = = = Graficamente, conforme representado na Figura 5, temos: Figura 5 Curva 5. Pela tabela da normal padronizada, a probabilidade entre 0 e 11,82 é 0,499999 ou 49,9999%. Assim, a ( )P X 780 50% 49,9999% 0,0001%> = − = , ou seja, a probabilidade de que a renda média da amostra pesquisada seja maior do que R$ 780,00 é de 0,0001%. Observe que, ao diminuirmos o desvio padrão, a probabilidade de ocorrer uma média extrema diminui, ou seja, a chance de a amostra ser não representativa reduz-se, já que, quanto menor o desvio padrão, mais homogêneos e mais próximos os dados são da média. 6) Refaça os cálculos do item 2, supondo que o desvio padrão populacional seja igual a R$ 133,54. Compare e analise os resultados. Vamos calcular novamente ( )650 X 700Ρ < < , com desvio padrão igual a 133,54 e 300n = elementos. Padronizando os valores, temos: X 650 688,89 38,89 38,89Z 5,04133,54 133,54 7,71 17,32300n µ σ − − = = = − = − = − X 700 688,89 11,11 11,11Z 1,44133,54 133,54 7,71 17,32300n µ σ − − = = = = = Graficamente, como é possível ver na Figura 6, temos: 74 © Estatística Aplicada Figura 6 Curva 6. Pela tabela da normal padronizada, a probabilidade entre 0 e 5,04 é 0,499999 ou 49,9999%, e a probabilidade entre 0 e 1,44 é 0,425066 ou 42,5066%. Assim: P (650 X 700) 49,9999% 42,5066% 92,5065%< < = + = Ou seja, a probabilidade de que a renda média da amostra pesquisada esteja entre R$ 650,00 e R$ 700,00 é de 92%. Observe que, ao diminuirmos o desvio padrão, a probabilidade de ocorrer uma média amostral em torno da média da população aumenta, ou seja, a chance de a amostra ser repre- sentativa eleva-se, já que, quanto menor o desvio padrão, mais homogêneos são os dados e mais próximos da média eles ficam. Exemplo 2 Pelos balanços realizados nos últimos anos, sabe-se que, em uma grande rede de super- mercados, a média de consumo (em unidades monetárias) é igual a R$ 80,00, com um desvio padrão igual a R$ 50,00. Considerando que uma filial dessa rede se localiza em Ribeirão Preto e que esta pode ser uma amostra da rede, se em um determinado dia existirem 100 clientes na filial, qual a probabilidade de que esses clientes consumam uma média maior do que R$ 75,00? Dados do problema: a variável em questão é o consumo em R$, que denotaremos por X, cuja média 80µ = e desvio padrão 50σ = . A amostra a ser utilizada possui 100n = clientes. Vamos calcular a probabilidade de a média da amostra de 100 clientes fornecer um valor maior do que R$ 75,00, ou seja, (X 75)Ρ > . Padronizando o valor, temos: X 75 80 5 5 1,0050 50 5 10100 Z n µ σ − − = = = − = − = − Graficamente, conforme representado na Figura 7, temos: Claretiano - Centro Universitário 75© U3 - Teoria da Amostragem Figura 7 Curva 7. Pela tabela da normal padronizada, a probabilidade entre 0 e 1,00 é 0,341345 ou 34,1345%. Assim, a (X 75) 50% 34,1345% 84,1345%Ρ > = + = , ou seja, a probabilidade de que o con- sumo médio da amostra pesquisada seja maior do que R$ 75,00 é de 84%. 8. DISTRIBUIÇÕES DE PROBABILIDADE AMOSTRAL DA PROPORÇÃO De maneira similar aodesenvolvido para a média amostral x , também podemos efetuar cálculos probabilísticos quando tratamos com variáveis qualitativas, substituindo a análise da média pela análise de uma proporção. Chamando de θ a proporção real de uma certa caracte- rística na população e de p a proporção observada dessa característica em uma amostra com n elementos. A fórmula da padronização para a proporção amostral p é dada por: (1 ) Z= n p θ θ θ ⋅ − − Vamos dar um exemplo de uma variável qualitativa para ilustrar a aplicação da fórmula. Exemplo 3 Um levantamento efetuado em um pregão da bolsa de valores mostrou que, naquele dia, do total de ações, 40% teve alguma valorização. Se um fundo selecionou um lote de 80 ações para negociar, qual a probabilidade de que nesse lote haja: 1) mais de 50% de ações que se valorizaram? 2) menos de 25% de ações que se valorizaram? Dados do problema: a variável em questão é o fato de a ação ter-se valorizado ou não, ou seja, uma variável qualitativa. Assim, a análise levará em conta a proporção populacional e amostral. A proporção populacional é 4040% 0,40 100 θ = = = , e o tamanho da amostra é 80n = . O interesse da primeira questão é calcular a probabilidade de haver mais de 50% de ações valorizadas na amostra, ou seja, a proporção amostral p ser maior do que 50 0,50 100 = , ou seja, P( 0,50)p > . Padronizando o valor, temos: 76 © Estatística Aplicada (1 ) 0,50 0,40 0,10 0,10 0,10 0,10Z= 1,82 0,0550,40 (1 0,40) 0,40 0,60 0,24 0,003 80 80 80n p θ θ θ ⋅ − −− = = = = = = ⋅ − ⋅ Graficamente, como é possível notar na Figura 8, temos: Figura 8 Curva 8. Pela tabela da normal padronizada, a probabilidade entre 0 e 1,82 é 0,465620 ou 46,5620%. Assim, a ( )0,50 50% 46,5620% 3,438%pΡ > = − = , ou seja, existe uma probabilidade de 3,438% de que o percentual de ações valorizadas na amostra seja superior a 50%. Quanto à segunda questão, o interesse é calcular a probabilidade de haver menos de 25% de ações valorizadas na amostra, ou seja, a proporção amostral p ser menor do que 25 0,25 100 = , equivalendo a P( 0,25)p < . Padronizando o valor, temos: (1 ) 0,25 0,40 0,15 0,15 0,15 0,15Z= 2,73 0,0550,40 (1 0,40) 0,40 0,60 0,24 0,003 80 80 80n p θ θ θ ⋅ − −− = =− =− =− =− =− ⋅ − ⋅ Graficamente, conforme representado na Figura 9, temos: Figura 9 Curva 9. Pela tabela da normal padronizada, a probabilidade entre 0 e 2,73 é 0,496833 ou 49,6833%. Assim, a ( )0,25 50% 49,6833% 0,3167%pΡ < = − = , ou seja, existe uma probabilidade de 0,32% de que o percentual de ações valorizadas na amostra seja menor do que 25%. Claretiano - Centro Universitário 77© U3 - Teoria da Amostragem 9. QUESTÕES AUTOAVALIATIVAS Confira, a seguir, as questões propostas para verificar o seu desempenho no estudo desta unidade: 1) Em uma determinada cidade, sabe-se que a média salarial de seus empregados é de R$ 1.000,00 ( 1000µ = ), com um desvio padrão igual a R$ 250,00 ( 250σ = ). Se uma amostra de 144n = empregados foi retirada desta população, determine a probabilidade de que a média salarial nesta amostra (x ) seja inferior a R$ 1.050,00. Determine também a probabilidade de que a média salarial desta amostra (x ) seja superior a R$ 900,00. 2) Em uma empresa, sabe-se que o número médio de acidentes de trabalho por funcionários em um ano é igual a 10 acidentes ( 10µ = ), com um desvio padrão de 8 acidentes ( 8σ = ). Uma inspeção da Delegacia do Trabalho será executada nesta empresa, averiguando por amostragem as pastas funcionais de 34 funcionários. Caso o número médio amostral (x ) de acidentes por funcionários for maior do que 12, a empresa sofrerá uma autuação. Então, determine qual a probabilidade de a empresa receber a autuação. 3) Em uma empresa especializada em produzir café em pó embalado em pacotes a vácuo, a máquina responsável pelo empacotamento tem uma configuração e calibragem programadas para encher a embalagem com uma quantidade específica, contudo, como é uma máquina sujeita a fatores externos, existe uma tolerância, ou seja, em média a máquina está programada para colocar 980 gramas de café ( 980µ = ), com um desvio padrão igual a 15 gramas ( 15σ = ). De tempos em tempos, os órgãos de defesa do consumidor costumam recolher lotes do produto para aferir o peso. Sendo assim, considere que o órgão de defesa do consumidor não aceite embalagens com menos do que 977 gramas em média (x ) de café e que foram recolhidas para análise 100n = embalagens. Qual a probabilidade de a empresa obter um resultado negativo na análise? 4) Um procedimento de controle de qualidade foi planejado para garantir um máximo de 10% de defeitos na produção ( 0,10θ = ). A cada 15 minutos, sorteia-se uma amostra de 40n = peças produzidas e, havendo mais de 15% de defeitos ( 0,15p = ), a produção é interrompida para verificações. Qual a probabilidade de a produção ser interrompida a cada 15 minutos? Gabarito Confira, a seguir, as respostas corretas para as questões autoavaliativas propostas. 1) A probabilidade de a média salarial amostral ser inferior a R$ 1.050,00 é de 0,8198% e de ser superior a R$ 900,00 é de 99,9999%. 2) A probabilidade de o número médio de acidentes ser maior do que 12 é de 7,2145%. 3) A probabilidade de obter-se uma média menor do que 977 gramas é de 2,2750%. 4) A probabilidade de a produção ser interrompida a cada 15 minutos é de 14,4572%. 10. CONSIDERAÇÕES Nesta unidade, caracterizamos as populações e destacamos a importância da teoria de amostragem, a fim de obterem-se dados para estudos e análises de populações numerosas. Em razão da impossibilidade de se pesquisarem todos os elementos, são necessárias distribuições amostrais para determinar probabilidades sobre as amostras. Dando continuidade aos nossos estudos, vamos transformar as distribuições amostrais em ferramentas de inferência, o que levará, na Unidade 4, ao conceito de estimação, com base no qual os valores serão analisados pelos critérios dos intervalos de confiança. 11. REFERÊNCIAS BIBLIOGRÁFICAS COSTA NETO, P. L. O. Estatística. 2. ed. São Paulo: Edgard Blϋcher, 2002. FONSECA, J. S. Curso de estatística. 6. ed. São Paulo: Atlas, 1996. 78 © Estatística Aplicada KAZMIER, L.; CRUSIUS, C. A. Estatística aplicada à economia e administração. São Paulo: Makron Books, 1982. LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. Estatística: teoria e aplicações. Rio de Janeiro: LTC, 2000. MARTINS, G. A. Princípios de estatística. 4. ed. São Paulo: Atlas, 1990. ______. Estatística geral e aplicada. 2. ed. São Paulo: Atlas, 2002. MEYER, P. L.; LOURENÇO FILHO, R. C. B. Probabilidade: aplicação a Estatística. Rio de Janeiro: LTC, 1975. MORETTIN, L. G. Estatística básica: probabilidade e inferência. São Paulo: Pearson, 2010. OLIVEIRA, F. E. M. Estatística e probabilidade. 2. ed. São Paulo: Atlas, 1999. STEVENSON, W. J.; FARIAS, A. A. Estatística aplicada à administração. São Paulo: Harper & How do Brasil, 1986. TRIOLA, M. F. Introdução à estatística. 7. ed. Rio de Janeiro: LTC, 1999.
Compartilhar