Baixe o app para aproveitar ainda mais
Prévia do material em texto
TE´CNICAS DE AMOSTRAGEM Paulo J. Ogliari INE/CTC/UFSC ogliari@inf.ufsc.br Exemplos na˜o cient´ıficos: Exame de sangue Testar um alimento (aroma, sabor, textura) Pesquisa cient´ıfica: Deseja-se conhecer algumas caracter´ısticas da populac¸a˜o (paraˆmetros) −→ observar uma amostra −→ estimativas para as caracter´ısticas individuais. 1 Exemplos: aceitabilidade da merenda escolar (proporc¸a˜o); consumo de hortalic¸as (proporc¸a˜o); estudo das condic¸o˜es de armazenamento, comercializac¸a˜o dos alimentos do ponto de vista nutricional; estudo da sanidade dos color´ıficos; estudo do queijo colonial da regia˜o serrana de SC, etc. Experimentos e Estudos Observacionais Experimento: sempre existe uma relac¸a˜o de: causa ⇒ efeito Exemplo: 3 meios de cultura ⇒ populac¸o˜es de bacte´rias (causa, tratamento) (efeito,resposta) ⇑ ⇑ Varia´veis independentes varia´veis dependentes Fator(es) 2 Estudos Observacionais: as pesquisas baseiam-se no registro da ocorreˆncia natural de caracter´ısticas ou propri- edades das unidades. Finalidades: descritiva, estimac¸a˜o ou detectar relac¸o˜es entre as caracter´ısticas (ana´lise multivari- ada). Alguns conceitos e exemplos Populac¸a˜o: e´ um conjunto real e finito de elementos pass´ıveis de serem mensurados, com respeito a`s varia´veis que se pretende levantar. Exemplos: propriedades agr´ıcolas, pessoas, alunos, supermercados. Podem ser Finitas ou In- finitas (푛 ≤ 0.05푁 , onde 푛 e´ o tamanho da amostra e 푁 e´ o tamanho da populac¸a˜o). Devemos definir: ”Populac¸a˜o amostrada” (de onde saira˜o as amostras. E´ mais limitada, mais acess´ıvel do que a populac¸a˜o objetivo) e ”Populac¸a˜o objetivo” (sobre a qual desejamos as informac¸o˜es. E´ a po- pulac¸a˜o finita total). Explicitar a populac¸a˜o respondendo: 3 1) o queˆ? 2)em quem? 3) onde? e 4) quando? Unidade de amostra: e´ a unidade a ser selecionada para se chegar aos elementos da populac¸a˜o. E´ a menor parte distinta da populac¸a˜o, identifica´vel para fins de enumerac¸a˜o e sorteio. Devemos definir qual a nossa unidade amostral. Devem cobrir, sem superposic¸a˜o, toda a populac¸a˜o. Se a unidade de sorteio e´ a mesma para observac¸a˜o e ana´lise, a unidade amostral sera´ o elemento. Por outro lado, se a populac¸a˜o for identificada por conjunto de elementos, a unidade amostral sera´ o conglomerado, ainda que a unidade de observac¸a˜o e ana´lise seja o elemento. Amostra: e´ uma parte da populac¸a˜o. Pode ser 푐표푚 e 푠푒푚 reposic¸a˜o. Paraˆmetros: sa˜o caracter´ısticas dos elementos da po- pulac¸a˜o. (Principais: Me´dia(휇), Proporc¸a˜o(휋), Variaˆncia(휎2) 4 e Total(휏 )). Estat´ısticas: sa˜o caracter´ısticas dos elementos da amos- tra. (Principais: Me´dia(푋¯), Proporc¸a˜o(푃 ), Variaˆncia(푆2) e Total(푌 )). Estimativas: os valores derivados dos dados da amos- tra com o objetivo de avaliar paraˆmetros desconhecidos. (Me´dia(푥¯), Proporc¸a˜o(푝ˆ), Variaˆncia(푠2) e Total(푦)) Exemplo 1: Objetivo geral: caracterizac¸a˜o (f´ısico, qu´ımico, microbiolo´gico e sensorial) do queijo colonial na regia˜o serrana de SC. Populac¸a˜o: todas as propriedades (unidades de amostra- gem) da regia˜o. Sera´ obtido um queijo (elemento da po- pulac¸a˜o). Amostra: uma parte das propriedades agr´ıcolas da regia˜o. Paraˆmetro: populac¸a˜o me´dia de coloˆnias de bacte´rias na populac¸a˜o. 5 Estimativa: e´ o valor nume´rico da populac¸a˜o me´dia de coloˆnias da amostra. Estat´ıstica: 푋¯ = Σ푋푛 6 Exemplo 2: Objetivo geral: estudar a situac¸a˜o econoˆmica dos fun- ciona´rios de uma Secretaria de Governo. Populac¸a˜o: todos os funciona´rios da Secretaria de Educac¸a˜o do Governo do Estado de SC no ano de 2002. Unidade de amostragem: funciona´rio. Amostra: uma amostra de 푛 elementos distribu´ıdos nas seguintes faixas salariais: ate´ 500 u.m. (푛1) de 501 u.m. ate´ 1500 u.m. (푛2) de 1501 ate´ 3000 u.m. (푛3) acima de 3000 u.m. (푛4) Paraˆmetro: proporc¸a˜o e o nu´mero dos que tem casa pro´pria na populac¸a˜o. Estimativa: a proporc¸a˜o e o nu´mero verificado na amostra. 7 Exemplo 3: Objetivo geral: identificar os fatores que dificultam o acesso aos programas de imunizac¸a˜o. Populac¸a˜o objeto: todas as crianc¸as menores de 13 meses residentes num determinado munic´ıpio, no ano de 2002. Populac¸a˜o amostrada: 85,5% da populac¸a˜o objeto. Unidade de amostragem: quadras residenciais (conglome- rados) Elemento: crianc¸as menores de 13 meses. Amostra: uma amostra de 450 crianc¸as observadas medi- ante o sorteio pre´vio de 45 quadras residenciais. Paraˆmetro: grau de instruc¸a˜o dos pais (proporc¸o˜es) na populac¸a˜o. Estimativa: a proporc¸a˜o na amostra. 8 Amostragem: relac¸o˜es entre populac¸o˜es e amostras Populac¸a˜o Plano de - amostragem Amostra ½ ½ ½ ½ ½ ½ ½ ½ ½ ½ ½ ½ ½ ½½=Z Z Z Z Z Z Z Z Z Z Z Z Z ZZ} Infereˆncia Estimativas dos paraˆmetros populacionais Alguns pontos importantes: ∙ A amostra deve ser obtida por processos adequados ⇒ planos de amostragem. ∙ A amostra deve ser representativa da populac¸a˜o. 9 ∙ Os problemas de amostragem exigem muito bom senso e experieˆncia. ∙ Geralmente exigem uma equipe multidisciplinar. Por que fazer amostragem? ∙ Economia. ∙ Confiabilidade dos dados (precisa˜o). ∙ Tempo. ∙ Operacionalidade. ∙ A populac¸a˜o pode ser infinita. ∙ Testes destrutivos. ∙ Atualizac¸a˜o. Situac¸o˜es em que o censo e´ mais vantajoso: ∙ A populac¸a˜o e´ pequena. ∙ Caracter´ıstica de fa´cil mensurac¸a˜o. 10 ∙ Necessidade de alta precisa˜o. ∙ O tamanho da amostra e´ grande em relac¸a˜o ao tamanho da populac¸a˜o. ∙ Ocasionalmente ja´ se dispo˜e de informac¸a˜o completa. Tipos de amostragem ∙ Aleato´rias ou Probabil´ısticas: a selec¸a˜o dos elementos da amostra e´ feita sob alguma forma de sorteio (aleato´rio). ∙ Na˜o Probabil´ısticas: e´ subjetiva ou por julgamento (espe- cialistas escolhem as unidades amostrais representativas ”intencional”). Amostragem por cotas. Exemplo: moi- nhos de farinha de mandioca no litoral central de SC, um te´cnico indicou, segundo seu julgamento, aquelas mais t´ıpicas. 11 Classificac¸a˜o das amostras probabil´ısticas A. Quanto a probabilidade igual para cada elemento diferente1 B. Quanto a unidade amostral2 individual conglomerado (uma microregia˜o, uma escola) C. Quanto a divisa˜o em subpopulac¸o˜es estratificada (bairro) na˜o estratificada D. Quanto ao nu´mero de esta´gios um u´nico mais de um3 (1o. munic´ıpio e 2o. estabelecimentos agr´ıcolas) E. Quanto a` selec¸a˜o aleato´ria sistema´tica 12 13 1 Temos uma varia´vel conhecida e com alto grau de cor- relac¸a˜o positiva com a varia´vel em estudo, a informac¸a˜o so- bre essa varia´vel pode ser usada para selecionar as unidades, de tal forma que diferentes unidades tenham diferentes pro- babilidades de selec¸a˜o, com o objetivo de obter estimativas precisas. Exemplo: numa amostragem de estabelecimentos comerciais, enquanto prepara-se a lista dos estabelecimentos, informac¸a˜o sobre o tamanho tambe´m e´ coletado, portanto, uma amostra de estabelecimentos poderia ser obtida de tal forma que cada estabelecimento tem uma probabilidade co- nhecida e diferente. 2 Exemplo: elemento da populac¸a˜o sa˜o as crianc¸as menores de 13 meses. No primeiro caso (unidade amostral indivi- dual), 450 crianc¸as foram sorteadas diretamente do registro de um servic¸o municipal de atendimento a` crianc¸a da ci- dade. No segundo caso (unidade amostral conglomerados) 14 450 crianc¸as foram observadas mediante o sorteio inicial de 45 quadras residenciais. 3 Usa-se amostragem em mu´ltiplos esta´gios principalmente devido a falta de um sistema de refereˆncia preciso e atuali- zado. Facilidade. Combinac¸o˜es: - Amostragem estratificada em va´rios esta´gios(idade, esco- laridade, sexo)- Amostragem na˜o estratificada num u´nico esta´gio - outras combinac¸o˜es 15 Plano de amostragem Para realizar um plano de amostragem e´ preciso definir: ∙ Os objetivos da pesquisa (explicitar, com precisa˜o, as evideˆncias pretendidas). ∙ Hipo´teses (expectativas) ∙ A populac¸a˜o a ser amostrada (o queˆ? em quem? onde? quando?). ∙ Os paraˆmetros a serem estimados (varia´veis a serem ob- servadas). ∙ Unidade de amostragem (e´ a unidade a ser selecionada para se chegar aos elementos da populac¸a˜o; algumas vezes coincide com os elementos da populac¸a˜o). ∙ A forma de selec¸a˜o da amostra, isto e´, o projeto (Aleato´ria 16 Simples, Sistema´tica, Estratificada, Conglomerados ou combinac¸a˜o disso. Vai fazer em esta´gios?). ∙ O tamanho da amostra (Geralmente resultara´ da conci- liac¸a˜o do atendimento do plano de ana´lise proposto com as limitac¸o˜es dos recursos dispon´ıveis). ∙ O custo do levantamento (atrave´s do custo de uma uni- dade amostral). ∙ Qual a confiabilidade e precisa˜o desejadas? ∙ Estudo piloto (Teste para a aplicac¸a˜o e ajuste de todas as deciso˜es tomadas na composic¸a˜o do processo). Usar pelo menos 50 ”elementos” se estimativas preliminares forem calculadas para determinar o tamanho da amostra. 17 Problema ba´sico Temos, X: uma varia´vel aleato´ria qualquer; Populac¸a˜o: 푋1, 푋2, ..., 푋푁 (valores de X para diferentes unidades amostrais, exemplo: quantidade de leite, em litros, entregue pelos fornecedores de um latic´ınio); Interessados em caracter´ısticas populacionais (paraˆmetros): Total: 휏 Me´dia: 흁 Proporc¸a˜o: 휋 Variaˆncia: 흈2 Objetivo da amostragem: e´ estimar uma ou mais des- sas caracter´ısticas com os dados de uma amostra de 푛 ob- servac¸o˜es da populac¸a˜o. Valores de X para a amostra: 푥1, 푥2, 푥3, ..., 푥푛 (푛 < 푁) Para estimar 흁 parece razoa´vel utilizar a me´dia da amostra 18 (푋) 푋 = 1 푛 푛∑ 푖=1 푋푖 Como avaliar as propriedades desse estimador (푋)? Uma possibilidade e´ investigar como os valores de 푋 (es- tat´ıstica) se comportam em relac¸a˜o a 흁 quando amostras sucessivas sa˜o retiradas. Amostragem probabil´ıstica Caracteriza-se por garantir, a priori, que todo elemento pertencente ao universo de estudo possua probabilidade, co- 19 nhecida e diferente de zero, de pertencer a` amostra sorteada. De modo equivalente, vamos considerar (pelo menos con- ceitualmente) todas as poss´ıveis amostras de tamanho 푛 : 푆1, 푆2, ..., isto e´, cada 푆푖 e´ uma amostra distinta de tama- nho 푛 retirada da populac¸a˜o. Um plano de amostragem probabil´ıstica associa uma pro- babilidade 휋푖 para cada 푆푖 e uma particular amostra,S, e´ escolhida de acordo com esta estrutura de probabilidade. Diferentes planos de amostragem probabil´ısticas esta˜o dis- pon´ıveis, correspondendo a diferentes distribuic¸o˜es de pro- babilidade 흅 = {휋1, 휋2, ...}. Exemplo: Populac¸a˜o: composta dos elementos (A, B, C, D, E), nos quais observa-se a caracter´ıstica X, e os resultados foram: 20 1,2,3,4,5. Assim, 푁 = 5, a me´dia populacional vale 흁 = 3, 0 e a variaˆncia populacional vale 흈2 = 2, 0. 푋 e´ uma varia´vel discreta. 21 Ca´lculo da variaˆncia populacional: 휎2 = ∑푁 푖=1(푥푖 − 휇)2 푁 = (1− 3)2 + (2− 3)2 + (3− 3)2 + (4− 3)2 + (5− 3)2 5 = 2, 0 휎 = √ 휎2 = 1, 4142 anos 22 Podemos retirar 10 amostras de tamanho 푛 = 3, sem re- posic¸a˜o, dessa populac¸a˜o. As amostras, e as me´dias amos- trais correspondentes sa˜o dadas por: nu´mero amostra 푋1;푋2, 푋3 me´dia prob(amostra) 1 A B C 1 2 3 2,00 1/10 2 A B D 1 2 4 2,33 1/10 3 A B E 1 2 5 2,67 1/10 4 A C D 1 3 4 2,67 1/10 5 A C E 1 3 5 3,00 1/10 6 A D E 1 4 5 3,33 1/10 7 B C D 2 3 4 3,00 1/10 8 B C E 2 3 5 3,33 1/10 9 B D E 2 4 5 3,67 1/10 10 C D E 3 4 5 4,00 1/10 23 Figure 1: Distribuic¸a˜o amostral da me´dia Todo o processo de amostragem probabil´ıstica define a dis- tribuic¸a˜o amostral que, por sua vez, representa a flutuac¸a˜o das estimativas obtidas. Observe, na tabela a seguir, que fo- ram encontrados valores para as me´dias das amostras entre 2 e 4, enquanto sabemos que a me´dia da populac¸a˜o e´ u´nica e vale 3. Observe, tambe´m, na figura, sua forma sime´trica. 푥 2,00 2,33 2,67 3,00 3,33 3,67 4 P(푋 − 푥) 0,10 0,10 0,20 0,20 0,20 0,10 0,10 A me´dia e a variaˆncia da distribuic¸a˜o amostral da me´dia e´ dada por: 흁푥 = 2.0, 10+2, 33.0, 10+2, 67.0, 20+ ...+4, 00.0, 10 = 3, 0 흈2푥 = 흈2 푛 . 푁 − 푛 푁 − 1 = 0, 667.0, 50 = 0, 3333. 흈푥 = √ 0, 3333 = 0, 5773 (Erro padra˜o). 24 휎푥¯ = 휎√ 푛 . √√√√√√√⎷ 푁 − 푛 푁 − 1 = 1, 4142√ 3 . √√√√√√⎷2 4 = 0, 5773 Portanto, a dispersa˜o dos resultados em torno do valor po- pulacional sera´, em me´dia, inferior a 1 unidade. Erro amostral 푒 = (푋 − 흁) tambe´m denominado de v´ıcio e, quanto menor sua magni- tude, menor sera´ a variabilidade das estimativas. Cada tipo de amostragem, portanto, exige estimadores apropriados para evitar a introduc¸a˜o de v´ıcio e a consequente quebra da validade das estimativas. De acordo com os princ´ıpios de amostragem probabil´ıstica podemos discutir algumas propriedades das estat´ısticas ou estimadores, p.e., na˜o-tendenciosidade e precisa˜o. Seja 휽 uma caracter´ıstica populacional e vamos estima´-lo 25 atrave´s de alguma func¸a˜o, 휽˜(푺), da amostra. 휽˜ e´ chamado de estat´ıstica ou estimador. 26 Exemplo: 푋(푒푠푡푖푚푎푑표푟) = 푓 (푋1, 푋2, ..., 푋푛) = 1 푛 푛∑ 푖=1 푋푖 Podemos discutir as propriedades do plano de amostragem e do estimador em termos da distribuic¸a˜o amostral de 휽˜: ⋄ diferentes valores de 휽˜⋄ e as probabilidades dadas por 흅. (As propriedades do plano de amostragem e do estimador sa˜o estudadas atrave´s da distribuic¸a˜o amostral) Na˜o-tendenciosidade: 퐸[휽˜(푆)] = 휽 onde E representa o valor esperado (me´dia). 27 Precisa˜o: 푉 푎푟[휽˜(푆)] = 퐸 ⎧⎨⎩ ⎡⎣휽˜(푆)− 퐸(휽˜(푆)) ⎤⎦2 ⎫⎬⎭ Quanto menor essa variaˆncia, maior e´ a precisa˜o do estima- dor. Eficieˆncia: Na˜o-tendenciosidade e commenor variaˆncia (Podemos com- parar diferentes estimadores e planos de amostragem) Acuracidade: 28 (a) Ri- fle A: na˜o- viesado, pouca pre- cisa˜o e pouca acura´cia (b) Ri- fle B: vi- e- sado, pouca pre- cisa˜o e pouca acura´cia (c) Ri- fle C: na˜o- viesado, boa pre- cisa˜o e boa acura´cia (d) Ri- fle D: vi- e- sado, boa pre- cisa˜o e baixa acura´cia Figure 2: Resultados de 15 tiros dos rifles A, B, C e D (ilustrac¸a˜o das propriedades dos estimadores). Fonte: Bussab e Morettin (2002). 퐸푄푀(휽˜(푆)) = 퐸 ⎡⎣휽˜(푆)− 휽 ⎤⎦2 Quanto menor este valor, melhor e´ o plano e o estimador. Uma representac¸a˜o gra´fica conjunta dos conceitos de pre- cisa˜o, acuracidade e auseˆncia de v´ıcio e´ feita atrave´s do es- quema dos tiros ao alvo. Veja figura 2. 29 O objetivo da teoria de amostragem e´ derivar planos amostrais econoˆmicos e fa´ceis de operar, os quais fornecem estimadores na˜o-tendenciosos e minimizem os efeitos da variac¸a˜o amostral. 30 Planejamento Amostral (Projetos amostrais) 1. AMOSTRAGEM ALEATO´RIA SIMPLES (AAS) Caracter´ıstica: Todos os elementos da populac¸a˜o tem igual probabilidade de pertencer a amostra, e todas as poss´ıveis amostras tem igual probabilidade de ser sorte- ada. A AAS serve quando a populac¸a˜o e´ razoavelmente homogeˆnea para a caracter´ıstica em estudo. Exemplo: verificar se um produto esta´ de acordo com as especificac¸o˜es. 31 Obtenc¸a˜o de uma amostra aleato´ria simples Pop. Infinita → exemplo: produc¸a˜o de uma ma´quina (anota-se as pec¸as, na ordem em que sa˜o produzidas, num determinado tempo). Pop. finita → lista completa (elementos ou unidades de amostragem) → numerar a populac¸a˜o de 1 ate´ N → sortear 푛 nu´meros dessa sequeˆncia ⇒ amostra aleato´ria. Uso da tabela de nu´merosaleato´rios ∙ Fac¸a uma lista dos elementos da populac¸a˜o; ∙ Numere consecutivamente os elementos na lista (1 a N); ∙ Leia os nu´meros na tabela de nu´meros aleato´rios, de modo que o nu´mero de algarismos em cada um seja 32 igual ao nu´mero de algarismos do u´ltimo nu´mero da sua listagem; ∙ Despreze quaisquer nu´meros que na˜o correspondam a nu´meros da lista, ou que sejam repetic¸o˜es de nu´meros lidos anteriormente. Continue o processo ate´ ter o nu´mero 푛 desejado de observac¸o˜es; ∙ Use os nu´meros assim identificados para escolher os elementos que va˜o fazer parte da amostra. Exemplo: Objetivo e´ estudar algumas caracter´ısticas dos funciona´rios de uma certa empresa. Vamos extrair uma AAS de ta- manho 5 (calcular o tamanho da amostra). 33 Table 1: Populac¸a˜o: funciona´rios da empresa Aristoleles Anasta´cia Arnaldo Ermı´lio Fabr´ıcio Cardoso Carlito Cla´udio Fel´ıcio Joa˜o Silva Ernestino Endevaldo Francisco Hiraldo Jose´ Souza Geraldo Gabriel Getu´lio Jose´ Silva Mauro Joana Joaquim Joaquina Maria Cristina Josefa Josefina Maria Jose´ Bernardino Paula Paulo Cesar Bartolomeu Erc´ılio ∙ Ler nu´meros na TNA com 2 algarismos ∙ Iniciar na 3푎 linha e 9푎 e 10푎 colunas Amostra de 푛 = 5 elementos { − −− , −−− , −−− , −−− , −−− } ↓ ↓ ↓ ↓ ↓ Varia´vel X em estudo { 푋1 푋2 푋3 푋4 푋5 } 34 Table 2: Populac¸a˜o: funciona´rios da empresa 01 Aristoleles 02 Anasta´cia 03 Arnaldo 04 Ermı´lio 05 Fabr´ıcio 06 Cardoso 07 Carlito 08 Cla´udio 09 Fel´ıcio 10 Joa˜o Silva 11 Ernestino 12 Endevaldo 13 Francisco 14 Hiraldo 15 Jose´ Souza 16 Geraldo 17 Gabriel 18 Getu´lio 19 Jose´ Silva 20 Mauro 21 Joana 22 Joaquim 23 Joaquina 24 Maria Cristina 25 Josefa 26 Josefina 27 Maria Jose´ 28 Bernardino 29 Paula 30 Paulo Cesar 31 Bartolomeu 32 Erc´ılio Me´todos de Estimac¸a˜o Objetivo: obter estimativas para valores populacionais desconhecidos, tais como a me´dia ou a proporc¸a˜o, atrave´s dos dados de uma aostra. Varia´veis quantitativas A estimativa da me´dia populacional, (휇), e´ feita atrave´s 35 da me´dia da amostra selecionada, calculada por: 푥¯ = ∑푛 푖=1 푥푖 푛 A variaˆncia populacional, 휎2푋 , e´ estimada atrave´s da variaˆncia da amostra: 푠2푋 = ∑푛 푖=1(푥푖 − 푥¯)2 푛− 1 36 A estimativa da variaˆncia da me´dia amostral sera´ calcu- lada, na amostra sorteada, por: 푠2푥¯ = (1− 푓 ) 푠2푋 푛 onde 푓 = 푛/푁 , e´ a frac¸a˜o de amostragem. Exemplo: Deseja-se estimar a concentrac¸a˜o me´dia de fumonisina, 휇, (micotoxina, milho armazenado), dada em 휇푔/푔, no Es- tado de Santa Catarina. Atrave´s de uma amostra casual simples de 10 armaze´ns, os resultados obtidos de concen- trac¸a˜o de fumonisina (푋) foram: 1,05 3,25 0,78 2,21 4,01 1,98 0,68 2,28 2,02 1,15 Os resultados obtidos, foram: 푥¯ = 1, 941휇푔/푔. 37 푠2푋 = 1, 1719 푠푋 = √ 1, 1719 = 1, 08 휇푔/푔 푠2푥¯ = 1, 1719/10 = 0, 1172 푝표푖푠, f=n/N −→ 0 (zero) 푠푥¯ = 0, 3426휇푔/푔. Varia´veis Qualitativas Exemplo Foi realizada uma pesquisa por amostragem em 4 esta- belecimentos comerciais no munic´ıpio de Floriano´polis, sobre o consumo de tomates minimamente processados. Duas varia´veis qualitativas de interesse foram: 1) O consumidor prefere tomates com casca de cor: a)verde, b) rosado ou c) vermelho; 2) Se o consumidor compraria o tomate fatiado e emba- lado. 38 No caso da varia´vel 2, deseja-se estimar a porcentagem (휋), de consumidores que comprariam o tomate fatiado e embalado. Em casos dicotoˆmicos, pode-se definir uma nova varia´vel quantitativa da seguinte forma: 푥 = 1 se compraria 푥 = 0 se na˜o compraria. Assim, a proporc¸a˜o de casos favora´veis na amostra, 푝, pode ser tratado como: 푥¯ = 푝 A variaˆncia de 푃 e´ calculada por: 푠2푃 = (1− 푓 ) ⎛⎜⎜⎜⎝ 푝.(1− 푝) 푛− 1 ⎞⎟⎟⎟⎠ onde p e´ a proporc¸a˜o na amostra. 39 Exemplo: os resultados obtidos na pesquisa (푛 = 400) questiona´rios foram: Consumo 푛푖=frequ¨eˆncia absoluta Consumiria 364 Na˜o consumiria 36 Total 400 푝 = 푥¯ = 364 400 = 0, 91 = 91% 푠2푃 = 푝.(1− 푝) 푛− 1 = 0, 91(0, 09) 400− 1 = 0, 0819 399 = 0, 00021 pois 1-f e´ desprez´ıvel 푠푃 = 0, 0143 = 1, 43% 40 No caso da varia´vel 1, cor da casca, com 3 categorias (politoˆmica), a variaˆncia da proporc¸a˜o e´ calculada como anteriormente: 푠2푃 = (1− 푓 ) ⎛⎜⎜⎜⎝ 푝.(1− 푝) 푛− 1 ⎞⎟⎟⎟⎠ fixando-se a categoria de interesse e reunindo todos os demais elementos (pertencentes a`s outras categorias) na classe que corresponde ao valor 0 (zero) para 푋 . Exemplo: Para estimar a proporc¸a˜o de consumidores que preferem tomates com casca de cor vermelha, teˆm-se: 푝 = 244 400 = 0, 61 푒 1− 0, 61 = 0, 39. 41 Portanto, 푠2푃 = 0, 61(0, 39) 400− 1 = 0, 000596 (variaˆncia da me´dia) 푠푃 = 0, 024 = 2, 4% (erro padra˜o da me´dia) Intervalos de Confianc¸a Deseja-se, a partir das estimativas pontuais, construir ex- presso˜es que com certo coeficiente de confianc¸a e grau de precisa˜o desejados, nos fornec¸am informac¸o˜es sobre os valores populacionais desconhecidos. Ou seja, desejamos construir um intervalo dentro do qual esperamos que es- teja o verdadeiro valor da caracter´ıstica em estudo. 42 Intervalo de confianc¸a para a concentrac¸a˜o me´dia de fu- monisina (vamos supor que a amostra seja grande). 푥¯ = 1, 941 푠푥¯ = 0, 3423 2, 00.푠푥¯ = 2, 00(0, 3423) = 0, 6846 푥¯− 2, 00푠푥¯ = 1, 941− 0, 6846 = 1, 2564 푥¯ + 2, 00푠푥¯ = 1, 941 + 0, 6846 = 2, 6256 1, 2564 ≤ 휇 ≤ 2, 6256 [1, 2564; 2, 6256] Podemos afirmar com 95% de confianc¸a que a verdadeira me´dia (휇) e´ um valor entre 1,2564 e 2,63. 푥¯± 2, 00 푠√ 푛 43 Intervalo de confianc¸a para a proporc¸a˜o dos consumidores que preferem tomates com casca cor vermelha. 푝ˆ = 0, 61 푠푃 = 0, 024 2, 00푠푃 = 2, 00(0, 024) = 0, 048 푝ˆ− 2, 00푠푃 = 0, 61− 0, 048 = 0, 562 푝ˆ + 2, 00푠푃 = 0, 61 + 0, 048 = 0, 658 0, 56 ≤ 휋 ≤ 0, 66 [0, 56; 0, 66] 푝ˆ± 2, 00 √√√√√√√⎷ 푝ˆ(1− 푝ˆ) 푛− 1 Podemos afirmar com 95% de confianc¸a que a verdadeira proporc¸a˜o e´ um valor entre 0,56 e 0,66. 44 Outros planos de amostragem ∙ Amostragem Sistema´tica ∙ Amostragem Estratificada Proporcional Uniforme ∙ Amostragem de Conglomerados 2. AMOSTRAGEM SISTEMA´TICA (AS) Caracter´ıstica: semelhante a amostra aleato´ria sim- ples (AAS). Situac¸a˜o de uso: quando os elementos da populac¸a˜o encontram-se naturalmente ordenados. Exemplos: fichas num ficha´rio, lista telefoˆnica, linha de produc¸a˜o. Como fazer para retirar uma amostra? 45 Exemplo: Populac¸a˜o = 800 clientes de uma fa´brica (N) Amostra = 50 clientes dessa fa´brica (n). Calcular o intervalo de selec¸a˜o = N/n. Exemplo: 800/50=16. Usando a tabela de nu´meros aleato´rios, vamos determi- nar onde comec¸ar na primeira sequeˆncia (N/n) Escolhemos para pertencer a amostra os seguintes ele- mentos: Y-e´simo = Y1; Y1 + N/n = Y2; Y2 + N/n = Y3; e assim por diante. A vantagem da AS esta´ na facilidade de selecionar a amos- tra. Assim como a AAS, a AS requer uma lista dos ele- mentos da populac¸a˜o. Cuidado se tiver dados com carater perio´dico. 46 Exemplo de amostragem sistema´tica Tamanho da pop. N=32 fun.; Obter uma AS de 푛 = 5 Table 3: Populac¸a˜o: funciona´rios da empresa 01 Aristoleles 02 Anasta´cia 03 Arnaldo 04 Ermı´lio 05 Fabr´ıcio 06 Cardoso 07 Carlito 08 Cla´udio 09 Fel´ıcio 10 Joa˜o Silva 11 Ernestino 12 Endevaldo 13 Francisco 14 Hiraldo 15 Jose´ Souza 16 Geraldo 17 Gabriel 18 Getu´lio 19 Jose´ Silva 20 Mauro 21 Joana 22 Joaquim 23 Joaquina 24 Maria Cristina 25 Josefa 26 Josefina 27 Maria Jose´ 28 Bernardino 29 Paula 30 Paulo Cesar 31 Bartolomeu 32 Erc´ılio Intervalo de selec¸a˜o: 32/5 ∼= 6. Observac¸a˜o: n mu´ltiplo de N. ( ) ( ) ( ) ( ) ( ) { , , , , } ↓ ↓ ↓ ↓ ↓ Varia´vel X em estudo { 푋1 푋2 푋3 푋4 푋5 } 47 3. AMOSTRAGEM ESTRATIFICADA (AE) Situac¸a˜o de uso: quando a populac¸a˜o apresenta grandevariabilidade com respeito a varia´vel em estudo. Nesse caso, procede-se a divisa˜o da populac¸a˜o de 푁 elemen- tos, em subpopulac¸o˜es, sem superposic¸a˜o (ESTRATOS) de tamanho 푁ℎ. Estes estratos devem ser internamente mais homogeˆneos que a populac¸a˜o toda. O crite´rio para a formac¸a˜o dos estratos deve ter relac¸a˜o com a(s) varia´vel(is) em estudo e, que derive estratos homogeˆneos. 48 Fatores que contribuem para a na˜o utilizac¸a˜o de uma AAS: (a) A populac¸a˜o e´ extremamente heterogeˆnea, o que acar- reta falta de precisa˜o nas estimativas. Exemplo: le- vantamento da renda familiar no munic´ıpio de Flo- riano´ipolis. (b) A populac¸a˜o se subdivide naturalmente em diferentes setores, a´reas de estudo ou regio˜es geogra´ficas. Neste caso ha´ interesse em enfocar cada parte isoladamente. Exemplo: levantamento de dados para as estimativas e previso˜es de produc¸a˜o de leite no Estado de Santa Ca- tarina, podemos ter: Regia˜o Litoraˆnea, Baixo, Me´dio e Alto Vale do Itaja´ı, Planalto e Oeste Catarinense. (c) Embora a populac¸a˜o seja homogeˆnea e na˜o se subdi- vida naturalmente em setores ou a´reas, a pro´pria natu- reza do problema nos indica a necessidade de se enfo- car isoladamente certos campos. Interesse em produzir 49 estimativas para os estratos. Nesse caso, a precisa˜o e´ fi- xada para cada estrato que passa a se chamar domı´nio. Exemplo: podemos estar interessados em estudar iso- ladamente cada grande supermercado de Fpolis. (d) Sistemas de refereˆncias diferentes, isso implica na aplicac¸a˜o de planos e/ou estimativas diferentes em cada estrato. (e) Deseja-se controlar o efeito de alguma caracter´ıstica na distribuic¸a˜o da caracter´ıstica que esta´ sendo avali- ada. Exemplo: o efeito da escolaridade sobre o estado nutricional de crianc¸as menores de 5 anos pode ser con- trolado pela composic¸a˜o de uma amostra que contenha os diversos n´ıveis de escolaridade dos chefes de famı´lia da populac¸a˜o estudada. (f) Deseja-se que a amostra mantenha a composic¸a˜o da populac¸a˜o segundo algumas caracter´ısticas ba´sicas. Por exemplo, em estudos sociais ou epidemiolo´gicos, e´ usual a obtenc¸a˜o de amostras que apresentam composic¸a˜o 50 segundo o sexo e a idade semelhante a` populac¸a˜o es- tudada. 51 Exemplos: 1- Estratificac¸a˜o pela qualificac¸a˜o dos opera´rios; 2- Estratificac¸a˜o dos supermercados da grande Floriano´polis; estratificac¸a˜o por nu´mero de caixas. 3- Estratificac¸a˜o de uma cidade em bairros; 4- Estratificac¸a˜o de uma populac¸a˜o por sexo, por n´ıvel de escolaridade, tamanho da cidade, idade; 5- Estratificac¸a˜o das empresas por volume de vendas ou por setores. 6- Estratificac¸a˜o das propriedades agr´ıcolas pelo nu´mero de vacas leiteiras. 52 Exemplo Objetivo: fazer um levantamento para estimar a pro- porc¸a˜o de aceitac¸a˜o de uma nova formulac¸a˜o de um ali- mento em uma populac¸a˜o de escolares de primeiro grau. A aceitac¸a˜o do novo alimento e´ diferente quando se con- sidera a idade e o sexo das crianc¸as, e´ recomenda´vel que essa populac¸a˜o seja estratificada por essas caracter´ısticas, antes da selec¸a˜o da amostra. 53 Obtenc¸a˜o da amostra Populac¸a˜o Estrato 1 Estrato 2Estrato 2 ......... Estrato k - - - Estrato 1 da amostra Estrato 2 da amostra Estrato k da amostra Amostra Estratificada Notac¸a˜o 푁 representa o tamanho da populac¸a˜o; 푁ℎ e´ o tamanho do ℎ-e´simo estrato da populac¸a˜o; 푊ℎ = 푁ℎ 푁 e´ o peso do estrato ℎ (ponderac¸a˜o), ℎ = 1, 2, ..., 푘. 54 Ca´lculo da me´dia estratificada: 푥¯푒푠푡 = 푘∑ ℎ=1 (푊ℎ푥¯ℎ) onde 푘 e´ o nu´mero de estratos, e 푥¯ℎ = ∑푛ℎ 푖=1 푥푖,ℎ 푛ℎ A variaˆncia da me´dia estratificada e´ dada por: 푠2푥¯푒푠푡 = 푘∑ ℎ=1 (푊 2ℎ푠 2 푥¯,ℎ) onde: 푠2푥¯,ℎ = (1− 푓ℎ) 푠2ℎ 푛ℎ , 푓ℎ = 푛ℎ 푁ℎ 55 e, 푠2ℎ = ∑푛ℎ 푖=1{푥푖,ℎ − 푥¯ℎ}2 푛ℎ − 1 O desvio padra˜o da me´dia estratificada e´ dado por: 푠푥¯푒푠푡 = √√√⎷푠2푥¯푒푠푡. Amostragem Estratificada Uniforme Sorteia-se igual nu´mero de elementos em cada estrato. 푛ℎ = 푛 푘 Uso: 56 1. Quando o interesse e´ derivar estimativas para cada es- trato, ou quando deseja-se comparar diversos estratos. 2. E´ recomenda´vel quando os estratos da populac¸a˜o fo- rem aproximadamente do mesmo tamanho. Exemplo: selecionar uma amostra estratificada uniforme de tamanho 푛 = 12 da comunidade da universidade. Nesse caso devemos selecionar quatro pessoas de cada ca- tegoria(Professores, Estudantes e Te´cnicos-Administrativos). 푛 = 12 푘 = 3 푛ℎ = 12/3 = 4, portanto, 푛1 = 푛2 = 푛3 = 4 Objetivo: deseja-se estimar o nu´mero me´dio de pessoas por famı´lia. Amostra 1 (Professores): 2 3 3 4 Amostra 2 (Estudantes): 4 5 6 6 57 Amostra 3 (T-A): 4 6 7 7 Ca´lculo da me´dia amostral ℎ 푛ℎ (푋푖,ℎ) 푥¯ℎ 푊ℎ = 푁ℎ 푁 1 4 (2,3,3,4) 3,00 2500/22500=0,11 2 4 (4,5,6,6) 5,25 15000/22500=0,67 3 4 (4,6,7,7) 6,00 5000/22500=0,22 Ca´lculo da variaˆncia amostral ℎ 푛ℎ 푓ℎ = 푛ℎ 푁ℎ 푠2ℎ 푠 2 푋¯,ℎ 1 4 4/2500=0,0016 0,67 (1-0,0016)0,67/4=0,1672 2 4 4/15000=0,0003 0,92 (1-0,0003)0,92/4=0,2299 3 4 4/5000=0,0008 2,00 (1-0,0008)2,00/4=0,4996 푥¯푒푠푡 = 3∑ ℎ=1 (푊ℎ푥¯ℎ) = (0, 11.3)+(0, 67.5, 25)+(0, 22.6, 00) = 5, 1675 58 푠2푥¯푒푠푡 = 3∑ ℎ=1 (푊 2ℎ푠 2 푋¯,ℎ) = = (0, 112.0, 1672)+(0, 672.0, 2299)+(0, 222.0, 4996) = 0, 1294 푠푥¯푒푠푡 = √ 0, 1294 = 0, 3597 pessoas/famı´lia. O desvio dos valores em relac¸a˜o a` me´dia e´, em me´dia, igual a 0,3597. O intervalo de confianc¸a fica: 푥¯푒푠푡±2, 00.푠푥¯푒푠푡 = 5, 1675±2, 00.0, 3597 = 5, 1675±0, 7194 4, 45 ≤ 휇 ≤ 5, 88. Podemos afirmar com 95% de confianc¸a que a me´dia real e´ um valor entre 4,45 e 5,88. 59 Amostragem Estratificada Proporcional Populac¸a˜o Professores Servidores Alunos - - - 20 % 20 % 60 % - Amostra Professores Servidores Alunos - - - 20 % 20 % 60 % A proporc¸a˜o na populac¸a˜o e´ mantida na amostra. A amostra sorteada sera´, portanto, considerada auto pon- derada, e o procedimento de estimac¸a˜o podera´ sofrer sim- plicac¸o˜es. Melhor quando as variaˆncias dos estratos sa˜o pro´ximas. 60 Exemplo: Objetivo: levantar o estilo de lideranc¸a preferido. Populac¸a˜o: 10 professores, 10 servidores e 30 alunos. Amostra: amostragem estratificada, proporcional por ca- tegoria, de tamanho 푛 = 10. (Podemos determinar 푛; precisamos de 푆2ℎ, precisa˜o e confianc¸a). 61 Populac¸a˜o 푃푟표푓푒푠푠표푟푒푠 : 푃1 푃2 푃3 푃4 푃5 푃6 푃7 푃8 푃9 푃10 푆푒푟푣푖푑표푟푒푠 : 푆1 푆2 푆3 푆4 푆5 푆6 푆7 푆8 푆9 푆10 퐴푙푢푛표푠 : 퐴1 퐴2 퐴3 퐴4 퐴5 퐴6 퐴7 퐴8 퐴9 퐴10 : 퐴11 퐴12 퐴13 퐴14 퐴15 퐴16 퐴17 퐴18 퐴19 퐴20 : 퐴21 퐴22 퐴23 퐴24 퐴25 퐴26 퐴27 퐴28 퐴29 퐴30 62 Ca´lculo do tamanho da amostra por estrato Estrato Proporc¸a˜o na populac¸a˜o Tamanho do estrato na amostra Fator de amostragem Professores 10/50=0,20 (20 %) 푛푝=20% de 10 = 2 푓1=2/10=0,20 Servidores 10/50=0,20 (20 %) 푛푠=20% de 10 = 2 푓2=2/10=0,20 Alunos 30/50=0,60 (60 %) 푛푎=60% de 10 = 6 푓3=6/30=0,20 Para selecionar aleatoriamente os elementos que va˜o for- mar a amostra, usar a tabela de nu´meros aleato´rios. Pode- se fazer amostragem sistema´tica, nova estratificac¸a˜o, fa- zer censo. Estratos sa˜o mais homogeˆneos que a populac¸a˜o, isto im- plica em resultados mais precisos (mais pro´ximos dos paraˆmetros da populac¸a˜o), e necessidade de menor ta- manho de amostra. 63 Exemplo 2: Objetivo: estimar o nu´mero me´dio de pessoas por famı´lia. Populac¸a˜o: 10 professores, 10 servidores e 30 alunos. Amostra: 푛 = 10 (2 professores (20%), 2 servidores (20%) e 6 alunos (60%)) 푛1 = 0, 20(10) = 2 (20%da amostra) 푛2 = 0, 20(10) = 2 (20%da amostra) 푛3 = 0, 20(30) = 6 (60%da amostra) A me´dia estratificada e a variaˆncia, simplificam-se para: 푥¯푒푠푡 = 푛∑ 푖=1 푥푖/푛 = 푥¯ 푠2푥¯푒푠푡 = (1− 푓 ) 푛 푘∑ ℎ=1 푊ℎ푠 2 ℎ 64 Ca´lculoda variaˆncia da me´dia amostral ℎ 푛ℎ (푥푖,ℎ) 푠 2 ℎ 푊ℎ = 푁ℎ/푁 푊ℎ푠 2 ℎ 1 2 (3,4) 0,50 10/50=0,20 0,10 2 2 (4,8) 8,00 10/50=0,20 1,60 3 6 (5,6,4,8,6,7) 2,00 30/50=0,60 1,20 푥¯ = 5, 5 pessoas/famı´lia 푠2푥¯푒푠푡 = ⎧⎨⎩ (1− 0, 20) 10 ⎫⎬⎭ 2, 90 = 0, 232 푠푥¯푒푠푡 = √ 0, 232 = 0, 4817 pessoas/famı´lia. O intervalo de confianc¸a fica: 5, 5± 2, 00.0, 4817 =⇒ 5, 5± 0, 9634 =⇒ 4, 5 ≤ 휇 ≤ 6, 5 65 Estimativas para proporc¸o˜es Partilha Proporcional Exemplo Objetivo: estimar a proporc¸a˜o de crianc¸as vacinadas na populac¸a˜o (휋). Populac¸a˜o: 984 crianc¸as menores de 12 meses. Estrato 1: crianc¸as com assisteˆncia pre´-natal, 푁1 = 325 Estrato 2: crianc¸as sem assisteˆncia pre´-natal, 푁2 = 659. Amostra: 푓1 = 푓2 = 푓 = 200/984 = 0, 2033 푛1 = 66 = 0, 2033× 325 푛2 = 134 = 0, 2033× 659 푛 = 66 + 134 = 200 66 Resultados: no estrato 1, 33 foram vacinadas e no estrato 2, 40 crianc¸as foram vacinadas. 푝푒푠푡 = 푥¯ = 200∑ 푖=1 푥푖/200 = 73/200 = 0, 365(36, 5%) Ca´lculo da variaˆncia: ℎ 푊ℎ 푛ℎ 푝ℎ (1− 푝)ℎ 푊ℎ(푝ℎ)(1− 푝ℎ)(푛ℎ/(푛ℎ − 1)) 1 325/984=0,3303 66 0,50 0,50 0,0838 2 659/984=0,6697 134 0,30 0,70 0,1417 푠2푝푒푠푡 = {( 1− 푓 푛 )( 푘∑ ℎ=1 푊ℎ(푝ℎ)(1− 푝ℎ) 푛ℎ 푛ℎ − 1 )} = 푠2푝푒푠푡 = 1− 0, 2033 200 (0, 0838 + 0, 1417) = 0, 000898 =⇒ 푠푝푒푠푡 = √ 0, 000898 = 0, 0299 ≃ 0, 03(3%) 67 Ca´lculo do intervalo de confianc¸a 퐼.퐶.(휋; 95%) : 푝푒푠푡 ± 1, 96.푠푝푒푠푡 : 0, 365± 1, 96(0, 0299) 0, 365± 0, 0586 0, 3064 ≤ 휋 ≤ 0, 4236 Podemos afirmar com 95% de confianc¸a que a proporc¸a˜o de crianc¸as vacinadas na populac¸a˜o e´ um valor entre 0,3064 e 0,0586. 68 4. AMOSTRAGEM DE CONGLOMERADOS (AC) Cada conglomerado e´ uma minipopulac¸a˜o ⇒ os conglo- merados sa˜o subgrupos heterogeˆneos. E´ adequada quando e´ poss´ıvel dividir a populac¸a˜o em um grande nu´mero de subpopulac¸o˜es. Vantagens: -Facilidade administrativa. -Tende a ser mais econoˆmica. -Na˜o exige uma lista de todos os elementos da populac¸a˜o. Basta uma lista dos conglomerados selecionados. Desvantagem: -Produz uma amostra que gera resultados menos precisos do que uma AAS ou AAE. 69 Populac¸a˜o dividida em conglomerados h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h hh hh hh h h h h h h h h h h h h h h h h h h h h h h h h h h h ⇓ Primerio esta´gio: selec¸a˜o aleato´ria de conglomerados ⇓ h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h h ⇓ Segundo esta´gio: selec¸a˜o aleato´ria de elementos 70 ⇓ Amostra: { h h h h h h h h } Exemplos: 1 - Numa populac¸a˜o de domic´ılios de uma cidade, os quarteiro˜es formam conglomerados de domic´ılios. 2 - Numa populac¸a˜o de propriedades agr´ıcolas no Estado de Santa Catarina, os munic´ıpios formam conglomera- dos. 3 - Numa populac¸a˜o de domic´ılios do Estado de Santa Catarina, podemos, no 1표 esta´gio, selecionar munic´ıpios, no 2표 esta´gio, selecionar quarteiro˜es e, finalmente, no terceiro esta´gio, selecionar domic´ılios. 71 Exemplo: Deseja-se sortear uma amostra de 500 escolares (elemen- tos). Vamos sortear algumas escolas e considerar todas as crianc¸as dessas escolas para compor a amostra. Se as es- colas tivessem o mesmo nu´mero de crianc¸as (퐵푗 = 100), o procedimento seria por conglomerados em um u´nico esta´gio, e (푛 = 푎.퐵푗) ou (500 = 5.100).퐵푗 e´ o tamanho do conglomerado 푗, onde cada escola e´ um conglomerado. Outros procedimentos (3 esta´gios): 50 escolas 7−→ 2 classes por escola 7−→ 5 crianc¸as por classe 25 escolas 7−→ 4 classes por escola 7−→ 5 crianc¸as por 72 classe. 73 Exemplo: Pesquisa Nacional por Amostra de Domic´ılios (PNAD) (Fundac¸a˜o IBGE). Primeiro esta´gio: amostras de munic´ıpios para cada uma das sete regio˜es geogra´ficas do Brasil. Segundo esta´gio: setores censita´rios sa˜o sorteados em cada munic´ıpio. Terceiro esta´gio: sorteados os domic´ılios. 74 Como selecionar a amostra? Primeiro esta´gio: selecionar conglomerados de elementos. Segundo esta´gio: 1)observa-se todos os elementos dos con- glomerados (amostragem em um esta´gio u´nico); 2) faz-se a selec¸a˜o de elementos dos conglo- merados (AAS, AS, AE, AC). 75 Exemplo: Selecionar uma amostra de domic´ılios de uma cidade de tamanho 푛 = 12 em 3 conglomerados(ruas). Pode-se tomar as ruas como conglomerados. Ruas Domic´ılios A A1 A2 A3 A4 A5 A6 B B1 B2 B3 B4 B5 B6 B7 B8 B9 B10 B11 B12 B13 B14 C C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 D D1 D2 D3 D4 E E1 E2 E3 E4 E5 E6 E7 Primeiro esta´gio: sorteio de conglomerados [ruas]. Segundo esta´gio: sorteio de domic´ılios, dentro de cada rua selecionada. 76 Sorteio de congloemrados Sorteio em dois esta´gios com probabilidade proporcional ao tamanho dos conglomerados. O sorteio dos conglomerados (ruas) e´ sistema´tico com intervalo (푖푛푡 = 41/3 = 13, 6 ≃ 14). Numa listagem em que os tamanhos de cada conglomerado (rua), 퐵푗, sa˜o organizados em intervalos de nu´meros acumulados ate´ o nu´mero total de elementos (41), identificam-se os nu´meros sorteados e as respectivas ruas. Se, por exemplo, o in´ıcio casual for igual a 9 (INC=9), os nu´meros sorte- ados (9, 9+14=23, 23+14=37) sera˜o identificados. Veja 77 tabela. Rua 퐵푗 Soma acumulada Intervalos Nu´meros sorteados 푓1 푓2 A 6 6 1-6 퐵∗ 14 20 7-20 9 3(14)41 4 14 퐶∗ 10 30 21-30 23 3(10)41 4 10 D 4 34 31-34 퐸∗ 7 41 35-41 37 3(7)41 4 7 ∗ ruas sorteadas. No 2∘ esta´gio sera˜o sorteados 4 domic´ılios em cada rua. 푓1 e´ a probabilidade da j-e´sima rua ser sorteada. 푓2 e´ a probabilidade do i-e´simo domic´ılio ser sorteado dentro da rua 푗. 78 AMOSTRAGENS NA˜O ALEATO´RIAS Dificuldade ou impossibilidade de obter uma AAS, prin- cipalmente devido a falta de uma listagem dos elementos da pop. Em geral, as amostras na˜o aleato´rias representam razoa- velmente bem a populac¸a˜o de onde foram extra´ıdas. 5. AMOSTRAGEM POR COTAS Esta amostragem e´ muito semelhante a amostragem es- tratificada proporcional. A populac¸a˜o e´ dividida em va´rios subgrupos. Para formar a amostra, seleciona-se uma cota de cada subgrupo, proporcional ao seu tamanho. 79 A selec¸a˜o dos elementos na˜o precisa ser aleato´ria. Dividir a populac¸a˜o num grande nu´mero de subgrupos. O entrevistador e´ instru´ıdo a coletar uma cota de in- div´ıduos do sexo M e F, de uma certa idade, classe social, etc., mas a selec¸a˜o dos elementos e´ deixado a cargo do en- trevistador. Exemplo: Objetivo: verificar o estado nutricional dos estudantes da rede escolar de uma cidade. 80 Caracter´ısticas: complementar os dados antropome´tricos com exames laboratoriais (alunos volunta´rios). Amostra: estratificada por n´ıvel escolar (1표 grau e 2표 grau) e por tipo de escola (pu´blica e privada), tomando- se volunta´rios em cada estrato. 81 6. AMOSTRAGEM POR JULGAMENTO As amostras sa˜o constitu´ıdas apenas por certos elementos que julgamos possuirem caracter´ısticas de boa represen- tatividade da populac¸a˜o a que pertencem. Sa˜o elementos t´ıpicos da populac¸a˜o em estudo. Exemplo: Objetivo: estudar a produc¸a˜o cient´ıfica dos departamen- tos de ensino de uma universidade. Amostra: alguns departamentos t´ıpicos. Limitac¸a˜o: os resultados podem na˜o ser va´lidos para toda a populac¸a˜o. 82 DETERMINAC¸A˜O DO TAMANHO DE UMA AMOSTRA ALEATO´RIA SIMPLES Para a determinac¸a˜o do tamanho da amostra e´ preciso fi- xar o erro ma´ximo desejado, o grau de confianc¸a e ter algum conhecimento a priori da variabili- dade da populac¸a˜o. Os dois primeiros sa˜o fixados pelo pesquisador, enquanto o terceiro pode ser obtido de pes- quisas passadas (refereˆnciasbibliogra´ficas) ou de amostras pilotos, tambe´m dos pro´prios dados de pesquisa. Outro pro- cedimento e´ considerar um intervalo onde aproximadamente 95% dos indiv´ıduos da populac¸a˜o estariam concentrados, e a´ı, igualar ao comprimento deste intervalo a quantidade 4휎 (pois, se os dados seguem aproximadamente uma dist. normal, enta˜o, 95% dos mesmos encontram-se no intervalo 푚 ± 2푑푝). Podemos, grosseiramente estimar 푠 tomando-se os 2 valores extremos dos dados dispon´ıneis e determinar a 83 amplitude. O tamanho da amostra depende tambe´m da estat´ıstica que se deseja estudar (me´dia, proporc¸a˜o ou total), se a amostra e´ com ou sem reposic¸a˜o e dos custos. Depende do projeto de coleta dos dados, ou seja, da forma. Conceito de erro amostral Chama-se de erro amostral a diferenc¸a entre o valor que a estat´ıstica pode acusar e o verdadeiro valor do paraˆmetro que se deseja estimar. 푒 = (휃ˆ − 휃). Aumentando-se o tamanho da amostra, as estimativas amos- trais aproximan-se cada vez mais dos valores populacionais (o erro amostral diminue). 84 Amostragem para estimar proporc¸o˜es(AAS) Se deseja-se estimar uma proporc¸a˜o na populac¸a˜o e que- remos, com n´ıvel (1 − 훼) de certeza, que a proporc¸a˜o da amostra esteja, no ma´ximo a uma distaˆncia 푒 da proporc¸a˜o verdadeira, enta˜o 푛 = 푍2훼푃 (1− 푃 )/푒2 = ⎛⎜⎜⎜⎝ 푍훼 푒 ⎞⎟⎟⎟⎠ 2 푝(1− 푝) onde: 훼 e´ o risco aceita´vel de que a proporc¸a˜o populacional esteja fora dos limites 푝± 푒; 푧훼 e´ o valor que elimina a a´rea 훼 de ambos os lados (bilateral) da distribuic¸a˜o 푛표푟푚푎푙 (valores obtidos na tabela da distribuic¸a˜o 푛표푟푚푎푙); 휋 e´ a proporc¸a˜o populacional. 푃 e´ a proporc¸a˜o da amostra. A proporc¸a˜o populacional geralmente na˜o e´ conhecida, enta˜o usa-se alguma estimativa para a mesma; pode ser de 85 um estudo anterior; pode-se tambe´m usar 푝 = 1/2, assim, 푛 = 푧2훼/4푒 2. Neste caso a amostra provavelmente sera´ su- perestimada. Para valores de 푃 muito pequenos (푃 < 0, 10), nesse caso a aproximac¸a˜o de Poisson pode ser usada e o ca´lculo do ta- manho da amostra e´ dado por: 푛 = 푧2훼푃/푒 2. Quando a amostra e´ sem reposic¸a˜o, e a frac¸a˜o de amostra- gem 푛/푁 na˜o e´ desprez´ıvel (푛 ≥ 0, 05푁), uma estimativa mais satisfato´ria do tamanho da amostra e´ dada por: 푛 ′ = 푛 1 + 푛/푁 (1) onde 푛 e´ obtido como na equac¸a˜o pre´via. Exemplo: Deve-se realizar uma pesquisa sobre consumo de hortalic¸as. Deseja-se determinar a proporc¸a˜o de pessoas que 86 consomen tomate no preparo da salada. Quantas pessoas devera˜o ser ouvidas para que sejam satisfeitas as seguintes condic¸o˜es: 푒 = 0, 05, 푝 = 60%, 훼 = 0, 05. Para 훼 = 5%⇒ 푧 ∼= 1, 96. O tamanho da amostra sera´: 푛 = (3, 84)(0, 60)(0, 40) 0, 052 = 369 pessoas. Para 푝 = 1/2, temos: 푛 = 푧2 4푒2 = 3, 84 4(0, 05)2 = 384 푝푒푠푠표푎푠. 87 Amostragem para a me´dia(AAS) O valor de 푛 e´ dado por: 푛 = ⎛⎜⎜⎜⎝ 푍훼푆 푒 ⎞⎟⎟⎟⎠ 2 onde S e´ o desvio padra˜o da amostra e Z e´ um valor obtido na tabela da distribuic¸a˜o normal padra˜o. Quando a amostragem e´ sem reposic¸a˜o e a frac¸a˜o de amos- tragem e´ maior ou igual a 5%usar a expressa˜o (??) para correc¸a˜o para populac¸a˜o finita. 88 Exemplo: Deseja-se realizar um estudo sobre o forneci- mento de leite, em litros, em uma cooperativa que reu´ne 180 pequenos produtores, no meˆs de dezembro. Dimensionar uma amostra, com grau de precisa˜o 푒 = 0, 10푦, com a fina- lidade de se estimar a me´dia, com um grau de confianc¸a de 95%. Utilizar uma amostra preliminar de tamanho 푛 = 12. Table 4: Amostra preliminar 150 400 320 140 300 285 285 300 310 230 500 474 Temos: 푍 = 2, 0, 푠2 = ∑푛 푖=1(푦푖−푦)2 푛−1 = 12.135, 42 푙푖푡푟표푠2, 푠 = 110, 16 litros e=0,10(307,8)=30,78 litros. Logo, 푛 = (2, 02)(12135, 42) 30, 782 = 51, 23 ∼= 52. 89 A frac¸a˜o 푛/푁 = 52/180 = 0, 2889 e a amostragem foi feita sem reposic¸a˜o, enta˜o o tamanho final da amostra sera´: 푛 ′ = 52 1 + 52/180 = 40, 3 ∼= 41. Enta˜o devemos acrescentar mais 29 fornecedores na amostra preliminar. 90 REFEREˆNCIAS BIBLIOGRA´FICAS Barbetta,P.A. (1998), Estat´ıstica Aplicada a`s Cieˆncias Sociais, Floriano´polis: Editora da UFSC. Bolfarine,H., and Bussab,W.O. (1994), ”Elementos de Amostragem,” 11표 Simpo´sio Nacional de Probabilidade e Estat´ıstica, Belo Horizonte, MG. Cochran,W.G. (1977), Sampling Techniques, 3.ed., New York: John Wiley & Sons. 1977. Silva,N.N. (1998), Amostragem Probabil´ıstica, Sa˜o Paulo: Editora da Universidade de Sa˜o Paulo. Som,R.K. (1996), Practical Sampling Techniques, New York: Marcel Dekker, Inc. 91 Software para amostragem: SAMPLING Enderec¸o: www.est.ufmg.br/ sampling/ (funciona acoplado ao MINITAB) Professora coordenadora: Sueli Ap. Mingoti. 92
Compartilhar