Buscar

Aula 14 - Introdução à Inferência

Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original

*
Introdução à Inferência Estatística
Referências: 
	BUSSAB e MORETTIN, Cap. 10, 11, 12.
 	WEBSTER, Cap. 6, 7 e 8.
	BARBETTA, Cap. 9, 10.
*
*
Introdução
O que foi visto até aqui no curso: 
	1) Como resumir descritivamente as informações de um conjunto de dados (gráficos, histogramas, tabelas de contingência, ramo e folhas, etc); 
	2) As medidas de tendência central (média, mediana, moda) e dispersão (variância, desvio padrão, assimetria, etc. ).
	3) Princípios de Probabilidade (Regras de adição e subtração, Teorema de Bayes, técnicas de contagem, etc)
	4) Distirbuições de probabilidade, identificadas por parâmetros, capazes de explicar o comportamento de algumas variáveis aleatórias (distribuições: Binomial, Hipergeométrica, Poisson, Exponencial, Uniforme).
O que veremos agora até o final do curso:
 3) Como generalizar resultados de uma amostra para a população de onde ela foi extraída; 
4) como testar hipóteses sobre a população com base numa amostra.
Estudaremos o problema de avaliar certas caracterísitcas dos elementos da população (parâmetros) com base em características dos elementos de uma amostra (estatísticas). 
*
*
Introdução 
Habitualmente usamos as informações de amostras para concluir sobre o todo. Por exemplo, para testar o nível de sal da comida que estamos preparando, provamos uma pequena quantidade da mesma; o consumidor na feira muitas vezes decide uma compra com base no pedaço de fruta que o feirante lhe oferece. Essas são decisões baseadas em processos amostrais. O que faremos daqui em diante é formalizar esses princípios intuitivos de amostragem, para serem utilizados de forma mais rigorosa (cientificamente) em situações mais complexas.
Já sabemos que uma estatística (amostra) é usada como um estimador do parâmetro (população). Mas para confiarmos nas conclusões feitas a partir de uma amostra, precisamos da inferência estatística.
A inferência estatística envolve a utilização de uma estatística para concluir (ou inferir) sobre o correspondente parâmetro. Dela fazem parte: o processo de amostragem , a estimação de parâmetros pontuais, a estimação de parâmetros usando intervalos de confiança, e a realização de testes de hipóteses sobre os parâmetros a partir das estimativas feitas. 
*
*
População e Amostra
Muitas vezes é impossível obter as informações que nos interessam de TODOS os elementos da população. Ela pode ser grande demais (imaginem se quiséssemos saber a altura média dos brasileiros), ou o processo pode exigir muitos recursos, ser muito demorado ou até mesmo destrutivo. 
Por exemplo: se quiséssemos saber a durabilidade média de um modelo de lâmpada, precisaríamos esperar que todas as lâmpadas produzidas se queimassem para calcularmos essa média...
*
*
População e Amostra
	O probelma pode também ser mais complexo: imaginem se desejamos saber se a altura (h) em que um produto é exposto na gôndola de um supermercado afeta a quantidade vendida do mesmo (Vh). Sejam as medidas de altura do produto h1=baixa, h2= média, e h3= alta, e as quantidades vendidas correspondentes V1, V2 e V3. Neste caso, precisamos conseguir dados sobre as vendas do produto em diferentes alturas. E não existe uma população de “todos os produtos” para a qual podemos recorrer para calcular os parâmetros populacionais. Assim, adotar modelos que expliquem o comportamento do todo (população) facilita a identificação e a solução do problema. Se supusermos que a variável aleatória vendas Vh segue uma distirbuição aproximadamente normal Vh ~N(μh, σ2) , podemos realizar um experimento para testar, com base na evidência dos dados da amostra, se é válida a hipótese μh1= μh2 = μh3. Isto é, será que a média de vendas de um produto independe da altura em que se econtra exposto nas prateleiras? Ou seja, as médias de vendas nas diferentes alturas são iguais?
*
*
População e Amostra
Soluções para questões como a colocada anteriormente são objetos da inferência estatística. Os dois conceitos básicos necessários para o desenvolvimento da inferência são população e amostra.
Exemplo: A prefeitura pretende avaliar a aceitação de um projeto de mudança no tranporte coletivo. 
Depois de apresentá-lo aos usuários, os responsáveis pelo projeto querem conhecer, mesmo que de forma aproximada, a proporção π de favoráveis ao projeto na população de usuários do transporte coletivo municipal. Note que π é o parâmetro (desconhecido) a ser estimado. Para estimar este parâmetro, a prefeitura planeja uma amostragem aleatória simples de n=400 usuários. A partir desta amostra, pretende-se calcular a estatística P = proporção de usuários favoráveis ao projeto (na amostra). 
Observada efetivamente a amostra, devemos ter P ≠ π, devido ao erro amostral. Então, será importante calcularmos a margem de erro que podemos estar comentendo por analisar apenas uma amostra e não toda a população. 
*
*
Definições importantes
População: é o conjunto de elementos para os quais desejamos que as conclusões da pesquisa sejam válidas, com a restrição de que esses elementos possam ser observados ou mensurados sob as mesmas condições.
Parâmetro: é uma medida que descreve certa característica dos elementos da população. 
Amostra aleatória simples (AAS): é um subconjunto da população, sendo que os elementos são extraídos ou selecionados por SORTEIO.
Estatística: alguma medida associada com os dados de uma amostra a ser extraída da população. Quando usada com o objetivo de avaliar (estimar) o valor de algum parâmetro, também é chamada de estimador.
Erro amostral: é a diferença entre uma estatística e o parâmetro que se quer estimar. 
Estimativa: valor da estatística (estimador), calculado com base na amostra efetivamente observada. 
Variável aleatória: é uma característica numérica associada aos resultados de um experimento. Mais rigorosamente falando, variável aleatória é definida como uma função, que associa resultados do espaço amostral (conjunto de resultados possíveis) ao conjunto dos números reais 
*
*
Observações
Em alguns casos (como no problema anterior de verificar se a altura h em que os produtos são expostos nas prateleiras do supermercado afeta o nível de vendas Vh), precisamos ampliar o conceito definido de população, designando-a como uma função de probabilidade ou função de densidade de probabilidade de uma variável aleatória X, de forma a modelar a caracterísitca de interesse. 
Esse artifício simplifica muito o problema estatístico, mas exige uma proposta de modelo para a variável X. Nestes casos, simplifica-se a linguagem dizendo: “seja a população f(x)” . Por exemplo, “considere a população das alturas X~ N (μ, σ2)”. 
A abordagem por meio da distirbuição de probabilidade utiliza muitas vezes o conceito de população infinita contínua, exigindo um tratamento matemático mais cuidadoso. É mais fácil apresentar os problemas e soluções por meio de populações finitas. Entretando, é importante que se saiba trabalhar com o conceito de modelo, explorando o caso de “população f(x)”
*
*
Problemas de Inferência
Vamos usar o exemplo clássico do lançamento de uma moeda, com o qual já estamos habituados, para exemplificar um problema de inferência estatística:
Seja X o número de “caras” obtidas depois de lançarmos a moeda 50 vezes. Sabemos que, independentemente da moeda ser ou não viciada, X segue uma distribuição binomial, ou seja, X ~ b(50, p).
Lançamos a moeda e obtemos 36 caras. Este resultado traz evidência de que a moeda seja “honesta”? Para tomarmos uma decisão, podemos partir do princípio de que p = ½. Com esta informação e com o modelo binomial, podemos encontrar qual a probabilidade de se obterem 36 caras ou mais no caso de p = 1/2, o que nos ajuda a tomar uma decisão. Suponha que o resultado seja rejeitar a “honestidade” da moeda. Neste caso, qual a melhor estimativa para p, com base no resultado observado?
Descrevemos acima os dois problemas básicos da inferência estatística: o primeiro é chamado teste de hipóteses,
e o segundo, estimação. 
*
*
Como selecionar uma amostra
As informações contidas em uma amostra são tanto mais informativas sobre a população quanto mais conhecimento tivermos sobre a população. 
Por exemplo: a medida da quantidade de glóbulos brancos contidos em algumas gotas de sangue da ponta do dedo de um paciente já dá uma ideia geral da quantidade de glóbulos brancos no corpo, pois sabe-se que a distirbuição de glóbulos brancos no sangue é homogênea, e de qualquer lugar que se tivesse retirado a amostra ela seria representativa. 
Porém, nem sempre a escolha de uma amostra adequada é imediata.
Outro exemplo: se quisermos obter uma amostra de habitantes para saber a opinião sobre um projeto governamental escolhendo intencionalmente uma amostra de 200 indivíduos moradores de certa região beneficiada pelo projeto, saberemos de antemão que o resultado conterá um viés de seleção. Isto é, na amostra, a proporção de pessoas favoráveis ao projeto deverá ser maior do que no todo. Dizemos neste caso que o resultado é “viesado”: não condiz com a verdadeira proporção (desconhecida) de pessoas favoráveis ao projeto na população.
*
*
Como selecionar uma amostra
Para evitar o problema de viés de seleção é importante a adoção de procedimentos científicos na hora de escolher a amostra que será usada para se fazer inferências sobre a população. 
A maneira de obter uma amostra é tão importante que dentro do ciência estatística há ramos de estudo especializados só nisso, como Amostragem e Planejamento de Experimentos.
Os procedimentos científicos para obtenção de dados amostrais podem ser divididos em três grandes grupos:
Levantamentos Amostrais: a amostra é obtida de uma população bem definida, por meio de processos bem protocolados e controlados pelo pesquisador. Esses processos podem ser ainda subdivididos em:
1.1 levantamentos probabilísticos: usam mecanismos aleatórios de seleção, atribuindo a cada elemento selecionado uma probabilididade conhecida a priori.
1.2 levantamentos não-probabilísticos: amostras intencionais, amostras de voluntários.
Planejamento de Experimentos: o principal objetivo neste caso é o de analisar o efeito de uma variável sobre a outra. Requer alguma interferência (ação) do pesquisador na população em estudo e o controle de fatores externos, com o intuito de medir o efeito desejado. Exemplos: estudo sobre se a altura em que os produtos estão expostos nas gôndolas afeta as vendas; estudos clínicos como se um medicamento é eficaz ou não para curar certas doenças. 
Levantamentos Observacionais: aqui os dados são coletados sem que o pesquisador tenha controle sobre as informações obtidas, como nas séries de dados temporais. Ex: prever as vendas futuras em função das vendas passadas.
*
*
Testes
Dê sua opinião sobre os tipos de problemas que surgiram nos seguintes planos amostrais:
Para investigar a proporção de alunos de RI da UFU favoráveis à mudança do início das aulas das 7h10 para as 8h00, decidiu-se entrevistar os 30 primeiros alunos que chegaram para as aulas na quinta-feira. 
Mesmo procedimento foi adotado, só que com o objetivo de estimar a altura média dos estudantes da UFU.
Para estimar a porcentagem média da receita municipal investida em lazer, foram enviados questionários a todas as prefeituras, e a amostra foi formada pelas prefeituras que enviaram as respostas. 
Para verificar o fato de oferecer brindes nas vendas de sabão em pó, foram escolhidos para teste 4 supermercados na zona sul e 4 na zona norte da cidade. Nas 4 lojas da zona sul, o produto era vendido com brinde, enquanto nas 4 lojas da zona norte era vendido sem brinde. No fim do mês, compararam-se as vendas da zona sul com as da zona norte. 
*
*
Amostragem aleatória simples
Iremos trabalhar até o final do curso basicamente com dados de levantamentos amostrais e, principalmente, um caso simples de amostragem probabilística: a amostragem aleatória simples com reposição
A amostragem aleatória é a maneira mais fácil de se selecionar uma amostra probabilística de uma população
O procedimento serve de base para o aprendizado e desenvolvimento de outros procedimentos amostrais
Amostras aleatórias simples finitas: 
Tem-se uma listagem de todas as N unidades da população. 
Para se obter uma amostra, pode-se escrever o número de cada unidade da população num cartão, coloca-los numa urna e depois sortear quantos elementos se desejar na amostra. 
Amostras aleatórias simples infinitas: enumera-se os elementos e em seguida eles são sorteados por meio de uma tabela de números aleatórios, ou por meio de computadores, que podem gerar números aleatórios. 
*
*
Amostragem aleatória simples
A amostra aleatória simples pode ser com ou sem reposição:
AAS com reposição: é permitido que uma unidade seja sorteada mais de uma vez.
AAS sem reposição: as unidades já sorteadas deixam de fazer parte da população.
Uma amostra sem reposição é mais adequada do ponto de vista da quantidade de informação sobre a população que a amostra contem. 
Porém, uma amostra com reposição é mais conveniente, pois leva a um tratamento teórico mais simples. A amostragem com reposição implica que há “independência” entre as unidades selecionadas, o que será de grande valia na derivação das propriedades dos estimadores. 
*
*
Exercício
A distribuição do número de filhos, por família, em uma zona rural, está dada no quadro ao lado.
Sugira um procedimento para sortear ao acaso uma observação dessa população.
Quais as posíveis amostras de duas famílias que podem ser formadas, e suas respectivas probabilidades, numa amostragem com reposição? 
Se fosse escolhida uma amostra de tamanho 4, qual seria a probabilidade de se observar a quádrupla ordenada (2, 3, 3, 1), supondo uma amostragem com reposição? 
*
*
Estatísticas e Parâmetros
Obtida uma mostra, desejamos usa-la para produzir alguma característica específica. Por exemplo, se quisermos calcular a média da amostra (X1, X2, …, Xn), esta será calculada por
Pode-se verificar que é também uma variável aleatória. Podemos estar interessados em qualquer outra cartacerística da amostra, que será sempre uma função do vetor aleatório (X1, …, Xn).
Definição: uma estatística é uma característica da amostra, ou seja, uma estatística T é uma função de X1, X2, …, Xn. 
Definição: um parâmetro é uma medida usada para descrever uma característica da população.
Assim, se estivermos colhendo uma amostra da população, identificada pela v.a. X, seriam parâmetros a média E(X) e sua variância V(X).
*
*
Símbolos mais comuns
*
*
Distribuições Amostrais
Como vimos, o objetivo da inferência estatística é fazer uma afirmação sobre o parâmetro da população através da amostra. 
Suponha que queiramos saber sobre o parâmetro θ (que pode ser a média, a variância, ou qualquer outra medida) e para isso retiramos uma AAS de n elementos. 
Nossa conclusão sobre θ será com base na estatística T, que será uma função da amostra (X1, X2, …, Xn).
Colhida a amostra, teremos um particular valor de T, digamos t0.
Com base em t0 é que faremos uma afirmação sobre o parâmetro populacional θ.
Nós teríamos uma confiança maior em nos basear em t0, para saber sobre θ, se pudéssemos calcular a estatística T para todas as amostras de tamanho n possíveis de serem sorteadas a partir da população.
Então saberíamos a distribuição de T quando (X1, X2, …, Xn) assume todos os valores possíveis → Essa distribuição é chamada distribuição amostral da estatística T.
*
*
Exemplos
Exemplo 1:
 Suponha que a população da variável X seja { 1, 3, 5, 5, 7}. 
Já sabemos construir a distribuição de probabilidade dos elementos Xi da população:
Se selecionarmos todas as amostras de tamanho 2 desta população, com reposição, obteríamos a distribuição conjunta da variável bidimensional (X1, X2):
*
*
Exemplos
Continuação exemplo 1:
Podemos também calcular
os possíveis valores da estatística , a média amostral de (X1, X2): 
 
Com base na tabela da distribuição amostral de (X1, X2), observamos a probablidade de ocorrência de cada par de (X1, X2) e de sua média (X1+X2)/2. Desta forma, obtem-se a distribuição da v.a. . Por exemplo, quando a amostra selecionada é o par (1, 1), a média será 1; então temos P( = 1) = 1/25. 
Obteremos a média igual a 3 quando as amostras sorteadas forem { (1,5), (3,3), (5,1)}. Logo, 
 
*
*
Exemplos
Continuação exemplo 1:
 Com um procedimento análogo, podemos obter a distribuição amostral de outras estatísticas de interesse, como a estatísitca W=amplitude total da amostra (X1, X2):
Distribuição amostral da amplitude W
 
*
*
Exemplos
Continuação exemplo 1:
 Agora vamos fazer a distribuição da variância da amostra: S2=∑(xi- )2 / (n-1)
Vamos supor que a amostra sorteada foi par (1, 1), com probabilidade associada de 1/25. A média amostral neste caso é (1+1)/2 = 1 e a variância da amostra é dada por
Se a amostra sorteada for o par (5,7), com probabilidade associada de 2/25, a média amostral será (5+7)/2=6 e a variância da amostra será
 
*
*
Exemplos
Continuação exemplo 1:
 Se procedermos no cálculo da variância amostral para cada par (X1, X2), e anotarmos a probabilidade associada, vamos obter a distribuição amostral da variância S2:
Distribuição amostral de S2
Iremos agora estudar as distribuições amostrais de algumas estatísticas importantes. Essas distribuições serão usadas para fazer inferências sobre populações daqui em diante.
ATENÇÃO: quando a população for identificada por meio de uma distribuição de probabilidade (Ex: Normal, Binomial, Poisson, etc), não será possível gerar todas as amostras possíveis. Assim, simularemos um número “grande o suficiente” de amostras pra ter uma idéia do que acontece com a estatística de interesse. 
 
*
*
Distribuição Amostral da Média
Vamos estudar agora a distribuição amostral da estatística , a média da amostra. 
A média μ da população {1,3,5,5,7} é 
E a variância σ2 é 
Lembrando que μ e σ2 são parâmetros que descrevem essa população.
*
*
Distribuição Amostral da Média
Como vimos, a distribuição amostral da média das amostras de tamanho 2 é
Já sabemos que a esperança de uma variável aleatória discreta, como é o caso de , é a média ponderada de todos os possíveis resultados da variável por suas respectivas probabilidades. 
Assim, temos que
Note que a média da distribuição amostral E( ), que daqui em diante simbolizaremos por , é igual à média da população original μ = 4,2. Isso não é por acaso: a distribuição amostral da média sempre terá média, chamada de média das médias, igual à da população!
*
*
Distribuição Amostral da Média
De modo análogo, podemos calcular Var( ):
Podemos verificar que Var( ) = 2,08 = 4,16/ 2 = σ2/2
O resultado para a variância da média das médias também não é por acaso. Pode-se provar que a variância da média é igual à variância de X na população, dividida pelo tamanho das amostras (aqui no caso n=2).
Determinamos, então, a média e a variância da distribuição amostral de .
*
*
Exercício
A população da produção semanal de uma fábrica, em toneladas, é 200, 250, 150, 200, 300. Forneça a distribuição amostral da média e calcule a média das médias e o erro padrão das médias para amostras de tamanho n=2 (com reposição).
*
*
Exercício - resposta
A população da produção semanal de uma fábrica, em toneladas, é 200, 250, 150, 200, 300. Forneça a distribuição amostral da média e calcule a média das médias e o erro padrão das médias para amostras de tamanho n=2 (com reposição).
Tamanho da população: N=5 
Tamanho das amostras: n=2
*
*
Exercício - resposta
Médias de amostras de tamanho 2:
Tamanho da população: N=5 
Tamanho das amostras: n=2
*
*
Métodos de Amostragem
Os métodos de amostragem , também chamados de planos probabilísticos, são utilizados em situações práticas, ou seja, quando precisamos de uma amostra representativa da população. Como escolher essa amostra?
Já foi falado que uma amostra que não represente a população introduzirá um erro amostral e produzirá estimativas pouco exatas do parâmetro populacional.
Há dois tipos básicos de erro amostral: 1) falta de sorte na retirada (coisas do destino); 2) vício amostral, resultado de uma tendência a favor da seleção de alguns elementos em detrimento de outros para a amostra. 
*
*
Métodos de Amostragem
Há muitas outras situações em que a seleção de uma amostra não é adequada e pode resultar em erro da estimativa do verdadeiro parâmetro. Por isso, quando se vai escolher uma amostra, é necessário seguir uma metodologia que minimize o risco de se incorrer em erro. Vejamos alguns exemplos:
Amostra Aleatória Simples (AAS): Neste plano, as n unidades que compõem a amostra são selecionadas de tal forma que todas as possíveis amostras têm a mesma probabilidade de serem escolhidas. Podemos ter AAS com e se reposição. A froma de se extrair uma AAS de tamanho n pode ser: escrever em um papel o nome ou número de cada elemento da população (mais adequado à populações pequenas), colocar tudo numa urna e sortear n elementos; numerar os N elementos da população e usar uma tabela de números aleatórios para se sortear n elementos; gerar números aleatórios para cada observação da população através do computador e escolher n números aleatoriamente que comporão a amostra. 
*
*
Métodos de Amostragem
Amostra Aleatória Estratificada: Nesse procedimento, a população é dividida em subpopulações ou estratos, usualmente de acordo com o valor ou a categoria de uma variável (característica). Em seguida, uma AAS é utilizada na seleção de uma amostra de cada estrato. O tamanho da amostra de cada estrato deve obedecer à proporção de elementos deste estrato relativamente aos demais, para que não haja nem sub representação e nem super representação de nenhum estrato na amostra final. 
Exemplo: A Região Nordeste tem enfrentado forte seca e o Governo Federal pretende estimar o impacto desta seca na produção pecuária da região calculando a taxa média de cabeças de gado perdidas por mês de seca. Para realizar uma amostra dos produtores da região, primeiro decidiu-se dividi-los em estratos de acordo com o estado ou UF. Não obstante, como o número de fazendeiros produtores de gado difere muito de um estado para o outro, a mostra de fazendeiros proveniente de cada estado obedeceu a proporção de fazendeiros do estado relativamente ao total de fazendeiros produtores na Região Nordeste. Assim, na amostra final, as proporções de produtores de cada estado da amostra respeita as proporções da população. 
*
*
Métodos de Amostragem
Amostragem aleatória por Conglomerados: como no caso de amostragem estratificada, a população é dividida em grupos (subpopulações) distintos, chamados conglomerados. Por exemplo, Podemos dividir uma cidade em bairros ou quadras. Usamos uma AAS para selecionar uma amostra de apenas alguns conglomerados e depois todos os indivíduos dos conglomerados selecionados são analisados. 
Exemplo: Usando o exemplo anterior, suponha que o Governo decida por uma amostra por Cnglomerados de fazendeiros produtores no Nordeste.Uma amostra de conglomerados pode ser coletada, por exemplo, identificando os municípios de cada estado como grupos ou conglomerados. Uma amostra desses grupos é escolhida aleatóriamente usando uma tabela de números aleatórios ou algum outro método aceitável.
Em seguida, todos os fazendeiros produtores dos grupos selecionados são incluídos na amostra final. Este tipo de procedimento pode facilitar e agilizar a pesquisa. Por exemplo, se é necessário que se visite cada fazenda da a mostra para se observar os efeitos da seca, é mais fácil visitar mais fazendas do mesmo município do que algumas fazendas de vários municípios. 
*
*
Métodos de Amostragem
Amostragem de Dois Estágios: A população é dividida em grupos, como em (c). Num primeiro estágio, através de AAS, selecionamos algumas subpoppulações. Num segundo estágio, usando novamente AAS, retiramos amostras das subpopulações selecionadas no primeiro estágio. 
Amostragem sistemática: Neste plano, supõe-se que temos uma listagem das unidades populacionais. Para um número fixo igual a k, sorteamos um elemento entre os k primeiros da listagem. Depois disso, observamos, sistematicamente, indivíduos separados por k unidades. Por exemplo, se k=10 e sorteamos inicialmente o oitavo elemento, observamos depois o décimo oitavo, vigésimo oitavo, trigésimo oitavo etc.
*
*
Determinação do tamanho de uma amostra
Até aqui, fizemos a suposição de que o tamanho da amostra, n, era conhecido e fixo. Em alguns casos, temos que determinar o tamanho da amostra a ser escolhida de uma população, de modo a obter um erro de estimação previamente estipulado, com determinado grau de confiança.
Exemplo: suponha que estejamos estimando a média μ populacional e para isso vamos usar a média amostral, , baseada numa amostra de tamanho n. Suponha que se queira determinar o valor de n de modo que
Em que γ é o grau de confiança da nossa estimativa, 0 < γ < 1. Um grau de confiança de 0,90 = 90% de confiança; 0,95=95% confiança; 0,99=99% de confiança!
 E ε é o erro amostral máximo que podemos suportar, ambos valores fixados. 
*
*
Determinação do tamanho de uma amostra
Sabemos que ~ N ( μ , σ2/n), logo - μ ~ N ( 0, σ2/n) e, portanto, podemos reescrever a desiguldade como 
 
Onde 
*
*
Determinação do tamanho de uma amostra
Dado o grau de confiança γ que queremos na nossa estimação, podemos obter os valores de z, relativos ao nivel de confiança desejado, a partir da curva Normal Padrão N(0,1) tal que P(-z ≤ Z ≤ -z) = γ, de modo que
Note que conhecemos zc e ε , mas não σ2, a variância desconhecida da população. Para podermos calcular n, precisamos ter alguma idéia prévia sobre σ2 ou, então, usar uma pequena amostra piloto para estimar σ2 .
*
*
Determinação do tamanho de uma amostra
Exemplo: Suponha que uma pequena amostra piloto de n=10, extraída de uma população, forneceu os valores de =15 e S2=16. Fixando-se o erro ε =0,5 e γ =0,95, temos
No caso de proporções, usando a aproximação normal para , o cálculo fica:
Como não conhecemos p, a verdadeira proporção populacional, podemos usar o fato de que p(1-p)≤1/4, para todo p, então temos
Por outro lado, se tivermos alguma informação sobre p ou pudermos estimá-lo usando uma amostra piloto, basta substituir este valor estimado na equação para n.
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*
*

Teste o Premium para desbloquear

Aproveite todos os benefícios por 3 dias sem pagar! 😉
Já tem cadastro?

Continue navegando