Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 Parâmetros: Um parâmetro é uma medida usada para descrever uma característica da população: o valor médio (), a dispersão em torno deste valor médio (2 ) ou a proporção de elementos com uma determinada característica (p). Estatísticas: Uma estatística T é uma função dos valores observados na amostra. Parâmetros e Estatísticas 1 População Amostra n x psX 22ˆˆ Amostra 1 Distribuição amostral da Média Amostral 2 1X 2X 5X kX 4X População Amostra 2 Amostra 3 Amostra 4 Amostra 5 Amostra k 3X x Variável X 2 Teorema Limite Central (TLC) Dado que : • A variável aleatória X tem distribuição (que pode ser normal, ou não), com média e desvio padrão . • Amostra de tamanho “n” são extraídas aleatoriamente dessa população. 3 Conclusões: • Na medida que o tamanho da amostra aumenta, a distribuição das médias amostrais tende para uma distribuição normal. • A média das médias amostrais será a média populacional. • O desvio padrão das médias amostrais será x n x 4 Teorema Limite Central (TLC) 3 Regras Práticas de Uso Comum: • Para amostras de tamanho n > 30, a distribuição das médias amostrais pode ser aproximada satisfatoriamente por uma distribuição normal. • Se a própria distribuição original tem distribuição normal, então as médias amostrais terão distribuição normal para qualquer tamanho amostral n. X 5 Teorema Limite Central (TLC) Coeficiente de Confiança (1- ) /2 /2 z/2 - z/2 A distribuição normal padronizada o valor z/2 é o valor crítico O grau de confiança é também chamado de nível de confiança ou coeficiente de confiança. Estimativa de uma Média Populacional: Grandes Amostras 6 4 Valores críticos mais comuns: 1 - 0,80 0,85 0,90 0,95 0,99 z/2 1,28 1,44 1,645 1,96 2,58 /2 /2 1 - 0 z/2 - z/2 Normal(0,1) 7 A margem de erro, denotado por E é a diferença máxima provável (com probabilidade 1- ) entre a média amostral observada e a verdadeira média populacional . X A margem de erro pode ser obtida multiplicando-se o valor crítico pelo desvio padrão das médias amostrais, n .zE 2 Margem de Erro 8 5 Áreas de uma distribuição amostral de usada para fazer declarações de probabilidade sobre o erro de amostragem /2 /2 Distribuição amostral da X (1- )% X n z 2/ 9 Intervalo de Confiança IC para A partir de uma amostra de uma distribuição f(x,), que depende de um parâmetro desconhecido, desejamos encontrar um intervalo aleatório que contenha com alta probabilidade é chamado de intervalo IC de (1-)% de confiança para )()( xLSxLI 1)()(Pr xLSxLI 10 6 Tamanho da Amostra para estimar Pode-se aplicar a fórmula E também para determinar o tamanho da amostra que é necessário para atingir um grau de precisão desejado . Resolvendo a equação do erro em n obtemos, 2 2 E z n n .zE 2 11 12 α 0.2 0.15 0.10 0.05 0.01 1-α 0.80 0.85 0.90 0.95 0.99 zα/2 1.28 1.44 1.645 1.96 2.58 Ex. :Tamanho de amostras para uma variável =10 para diversos Coeficientes de Confiança: 7 13 Ex. :Tamanho de amostras cujo =10 para diversos Coeficientes de Confiança: Intervalo de Confiança para a média populacional : EXEX Onde n .zE 2 n zX; n zX 22 Outras formas equivalentes de escrever: • com variância conhecida o intervalo de confiança 100(1-)% para Intervalo de Confiança (IC) para 14 8 Intervalo de Confiança (IC) para Exemplo 1: Uma amostra de n=40 de uma variável aleatória X tem distribuição Normal com média desconhecida e variância = 410. Qual o intervalo de confiança de 95% para .? 1428X 96,1025,02/ zz 15 ]06,1555;94,1300[ 06,1271428;06,1271428; EXEX O IC para com 95% de confiança para é [1300,64 ; 1555,06] 06,127 40 410 96,12/ n zE n = 40, = 410 16 • com variância desconhecida, substituímos 2 por S2 , a variância amostral: - Para n grande da ordem de 100 podemos usar a distribuição normal para construir o IC(1-) Intervalo de Confiança para a média populacional Intervalo de Confiança (IC) para - Para n não muito grande, a distribuição normal NÃO pode ser usada. n S zX n S zX 22 ; 9 17 • Seja (X1, X2, ... Xn ) uma amostra aleatória proveniente de uma distribuição Normal com variância desconhecida. Se substituímos 2 por S2, se n for grande o efeito desta substituição é muito pouco, pelo que podemos usar a distribuição normal; se n for pequeno devemos usar uma distribuição t, então o intervalo de confiança 100(1-)% para é dado por Intervalo de Confiança (IC) para n S tX n S tX nn 11 ; Onde t é o percentil (1 - /2) da distribuição t com n -1 graus de liberdade. 18 Distribuição t de Student Graus de liberdade P(T<x) 0,95 0,99 0,975 0,995 0,9995 1 6,314 12,706 31,821 63,657 636,62 2 9,925 6,965 4,303 2,920 31,598 10 3,163 2,764 2,228 1,812 4,587 22 2,756 2,462 2,045 1,699 1,311 Ex.: Seja X uma variável aleatória com t de Student com com 10 g.l. Pr[X < 2,764] = 0,99 xt Pr[X < xt ] 10 Intervalo de Confiança (IC) para Exemplo 1: Uma amostra de n=30 de uma variável aleatória X tem distribuição Normal com média e variância desconhecida. Qual o intervalo de confiança de 95% para .? 1200X 0227,2025,02/ tt 19 ]72,1347;28,1052[ 72,1471200;72,1471200; EXEX O IC para com 95% de confiança para é [1052,28; 1347,72] 72,147 30 400 0227,22/ n S tE n = 40, S= 400 20 O objetivo dos testes de hipóteses é avaliar afirmações sobre os valores de parâmetros. A Hipótese Nula é uma afirmação que diz que o parâmetro populacional é tal como especificado (isto é, a afirmação é verdadeira), denotado por H0 A Hipótese Alternativa é uma afirmação que oferece uma alternativa alegação, Isto é, o parâmetro é maior (ou menor) que o valor alegado), denotado por H1. Testes de Hipóteses 11 21 Procedimento: 1) Formula as hipóteses: 01 00 : : H H 01 00 : : H H 01 00 : : H H Teste unilaterais Testes de Hipóteses para a Média Populacional 2) Escolher o nível de significância, em geral = 0,01 ou = 0,05; Teste bilateral 3ª ) Calculando o intervalo de Confiança (1-)% - para a média populacional : n zX; n zX 22 22 Testes de Hipóteses paraa Média Populacional Se 0 IC(1-)% rejeitamos H0. n S tX n S tX nn 11 ; ou 01 00 : : H H 12 Intervalo de Confiança (IC) para proporções n x p ˆ n pp p )ˆ1(ˆ ˆ 23 )1(2 ppep Se Y ~ Binomial(n,p), onde , dada uma amostra aleatória de tamanho n com x elementos com a característica de interesse, a proporção amostral é definida por . Na medida que np > 5 e n(1-p)> 5, a distribuição da proporção amostral tende a uma distribuição Normal satisfatoriamente, O valor médio das proporções amostrais será p e o desvio padrão das proporções amostrais será O Teorema Limite Central pode justificar a ideia de Aproximação Normal à Binomial. Para n grande podemos considera a distribuição amostral de p como aproximadamente normal EpEp ˆ;ˆ Logo, temos que o IC para a proporção populacional ao nível de significância (1-) : Intervalo de Confiança (IC) para proporções n pp pNp )1( ,ˆ Para construir o IC para p desconhecida, determinarmos na amostra e consideremos pˆ n pp p )ˆ1(ˆ ˆ 24 n pp zE )ˆ1(ˆ 2 onde 13 Tamanho da Amostra para estimar p Se tivermos alguma informação sobre p, resolvendo a equação do erro em n obtemos, 2 2 2/ )1( E ppz n 4 1 1 pp 25 Se a verdadeira proporção é desconhecido, podemos usar o fato que para qualquer valor de p temos que n pp zE )1( 2 Então o valor de n pode ser aproximado pela relação: 2 2 2/ 4E z n Exemplo: Retiramos de uma população uma amostra de 100 elementos e encontramos 20 sucessos. Construir um IC com 99% de coeficiente de confiança, para a proporção real de sucessos na população. Dados n=100, x=20 .99,03028,0;0972,0 99,004,0.57,22,004,0.57,22,0 99,0ˆ;ˆ ˆˆ 22 P pP zpzpP pp Logo, temos o IC com 99% de coeficiente de confiança para a proporção populacional: Intervalo de Confiança (IC) para proporções 8,0)ˆ1(2,0 100 20 ˆ pe n x p 04,0 100 8,0.2,0 ˆ p 26
Compartilhar