Baixe o app para aproveitar ainda mais
Prévia do material em texto
Distribuições de Probabilidades de Estatísticas Amostrais (Estimadores) ◦ 2.1 – A Distribuição da Média Amostral. ◦ 2.2 – O Teorema do Limite Central. ◦ 2.3 – A Distribuição da Proporção Amostral. ◦ 2.4 – Aplicações. Introdução A inferência estatística envolve a formulação de certos julgamentos sobre um todo após examinar apenas uma parte, ou amostra, dele. Assim é que podemos receber uma amostra de um novo produto alimentício num supermercado; certamente queimaremos a língua se tentarmos provar um pedaço de torta recém-saída do forno; o cozinheiro prova a sopa para ver se precisa de um pouco mais de sal. Analogamente, quando passamos os olhos sobre um novo livro ou uma revista, ou experimentamos uma roupa nova, ou vemos um programa de TV por uns poucos minutos para decidir se mudamos ou não de canal — na realidade estamos fazendo amostragem. Introdução A amostragem estatística é semelhante a cada um dos exemplos anteriores, embora seus métodos sejam mais formais e precisos e incluam tipicamente uma afirmação probabilística. Assim, a probabilidade e a amostragem estão estreitamente relacionadas e, juntas, formam o fundamento da teoria da inferência. Introdução A finalidade da amostragem é obter uma indicação do valor de um ou mais parâmetros de uma população, tais como a media, o desvio padrão populacional, ou a proporção de itens que possuem determinada característica. As estatísticas amostrais que correspondem a esses parâmetros populacionais são usadas para aproximar os valores desconhecidos daqueles parâmetros. Assim é que a média amostral (é uma estatística, uma VA!) é usada para estimar a média da população, o desvio padrão amostral é usado para estimar o desvio padrão populacional, e a proporção amostral serve para estimar a proporção na população. Introdução Uma das realidades da amostragem aleatória é que, quando se extraem repetidas amostras da mesma população, há uma tendência de a estatística amostral variar de uma amostra para outra, e também em relação ao verdadeiro valor do parâmetro, simplesmente em razão de fatores casuais relacionados com a amostragem. Essa tendência é conhecida como variabilidade amostral. (Por essa razão, quase sempre podemos estar certos de que determinada estatística amostral não é igual ao correspondente parâmetro populacional.) Introdução Então, qualquer tentativa para fazer inferências sobre uma população deve levar em conta a variabilidade amostral. De modo geral, pode parecer difícil lidar, de maneira racional, com a variabilidade amostral. No caso da amostragem aleatória, entretanto, demonstra-se matematicamente que a variabilidade pode ser descrita por distribuições de probabilidades tais como a normal e a binomial. Introdução Quando as distribuições de probabilidade são usadas dessa maneira, são conhecidas como distribuições amostrais. E como essas distribuições só podem ser utilizadas quando se trata de amostras aleatórias, é essencial usar somente amostras aleatórias para fazer inferência estatística. Introdução A questão a responder para cada amostra é: Quão próxima está a estatística amostral do verdadeiro valor do parâmetro populacional? Introdução A resposta depende de três fatores: ◦ a estatística que está sendo considerada (para descrever a variabilidade associada a diferentes estatísticas amostrais, usam-se diferentes distribuições de probabilidade). ◦ o tamanho da amostra (há menor variabilidade entre estatísticas de grandes amostras do que entre estatísticas de pequenas amostras). ◦ a variabilidade existente na própria população submetida a amostragem (populações com muita variabilidade produzem estatísticas amostrais com maior variabilidade do que populações com pequena variação entre os valores populacionais). ◦ Introdução Inicialmente é difícil assimilar o conceito de distribuição amostral. Examinemos por isso uma distribuição amostral simples. Suponhamos que um fazendeiro deseja vender alguns porcos. Para simplicidade, limitemos a população a 5 porcos. Para nossos propósitos, suponhamos sejam conhecidos os pesos dos porcos (embora o fazendeiro não os conheça). Os pesos constam da Tabela abaixo. Introdução Suponhamos que qualquer porco com menos de 205 lb de peso seja considerado magro, não podendo ser vendido a preço razoável. Vemos que 2 deles, ou seja, 2/5 da população, estão nessa categoria. O fazendeiro quer agora estimar a proporção de seus porcos que estão abaixo do peso. Como é muito trabalhoso pesar todos os animais, ele resolve tomar uma amostra de 2 e usar a proporção amostral para estimar a proporção populacional. As perguntas que devemos responder são: ◦ Que proporções amostrais são possíveis? ◦ e quão viável é cada uma? ◦ Em outras palavras, queremos a distribuição amostral da situação. Introdução Como uma distribuição amostral deve indicar os resultados possíveis, comecemos por identificá-los. Presumivelmente, o fazendeiro faria amostragem sem reposição, pois não desejaria pesar o mesmo porco duas vezes. A Tabela a seguir ilustra os resultados amostrais possíveis. Introdução A distribuição amostral aponta que as proporções amostrais possíveis são 0/2, 1/2 e 2/2, ou 0%, 50% ou 100%. Mostra também quão provável é cada proporção, sob a hipótese de que cada porco tenha a mesma chance de ser incluído na amostra (isto e, amostragem aleatória). Introdução Por exemplo, há uma probabilidade de 0,6 de a proporção amostral ser 1/2, o que está próximo da proporção real (como são usadas amostras de 2, seria impossível termos uma proporção amostral de 2/5). Introdução Se escolhêssemos a distribuição para amostras de 3 observações para a mesma população, a distribuição da proporção de porcos com deficiência de peso seria a da Figura abaixo. Note-se que nesse último caso os resultados são diferentes dos do caso de amostras de tamanho 2. Introdução Conquanto essa abordagem empírica das distribuições amostrais não seja prática, pois exige a listagem de todos os resultados possíveis, permite, não obstante, considerar em pequena escala o que uma distribuição amostral realmente é. Na prática, as distribuições amostrais são deduzidas matematicamente e colocadas à disposição dos analistas sob forma de tabelas e gráficos. Vamos, em seguida, explorar algumas formas como uma população pode influenciar uma distribuição amostral. Efeito dos parâmetros populacionais sobre uma distribuição amostral Sabemos que as distribuições amostrais tendem a produzir estatísticas amostrais representativas dos parâmetros populacionais (Isto é, apesar do fato de apresentarem certa variabilidade, as estatísticas amostrais devem aproximar parâmetros populacionais de forma bastante satisfatória). Esta característica de ser representativa resulta em estatísticas amostrais que tendem a se acumular na vizinhança dos verdadeiros valores populacionais. Assim, população com médias (ou qualquer outro parâmetro populacional) determinadas tendem a gerar amostras cujas médias (ou outro parâmetro de interesse) orbitem em torno do verdadeiro valor, seu valor populacional. Efeito do tamanho da amostra sobreuma distribuição amostral Quanto à influência do tamanho da amostra, sabemos que quanto maior a amostra, menor é a variabilidade do parâmetro amostral considerado. A figura ao lado representa a influência do tamanho da amostra no parâmetro de interesse.
Compartilhar