Baixe o app para aproveitar ainda mais
Prévia do material em texto
Probabilidade, Amostragem e Distribuição Considere a distribuição de probabilidade da variável aleatória discreta X: Histograma Probabilidade, Amostragem e Distribuição Se tomarmos os pontos médios das bases superiores dos retângulos e os ligarmos por uma curva, chega-se a X uma variável aleatória contínua, uma função contínua f(X): Uma variável aleatória X é contínua em se existir a função f(x): VARIÁVEL REDUZIDA OU PADRONIZADA: muito útil para comparar distribuições e detectar dados atípicos – evento aleatório Define-se um dado atípico quando Z > 3 Z = 1,5 significa que a observação está 1,5 desvios padrões para cima da média Probabilidade, Amostragem e Distribuição X Y Z(X) Z(Y) 10 2 -1,05391 -1,66601 23 5 0,076056 -0,97662 45 7 1,988308 -0,51704 12 10 -0,88007 0,172345 32 9 0,858341 -0,05745 10 12 -1,05391 0,631933 18 17 -0,35855 1,780903 27 12 0,423738 0,631933 VARIÁVEL REDUZIDA OU PADRONIZADA - Exemplo Média de X= 22,12 Desvio Padrão de X = 11,50 Média de Y= 9,25 Desvio Padrão de Y = 4,35 Média de Z(X) e Z(Y)? Desvio Padrão de Z(X) e Z(Y)? Probabilidade, Amostragem e Distribuição Probabilidade, Amostragem e Distribuição A Distribuição Normal Padrão A distribuição normal padrão é uma distribuição com forma normal, de média 0 e desvio padrão igual a 1. Essa e outras características, permite comparar valores de amostras diferentes, valores de uma mesma amostra e muito mais. Probabilidade, Amostragem e Distribuição EXEMPLO – USO DA NORMAL PADRONIZADA Média do teste de QI é 100 com desvio padrão de 15. Se você tem um valor médio de 135. Como você está posicionado? = 135-100/15 = 2,33 1 2 2,33 Mais que dois desvios acima da média Probabilidade, Amostragem e Distribuição Assim, após convertemos para os valores z, pode-se utilizar a distribuição normal de vária maneiras, pois a distribuição normal é uma distribuição de probabilidade. Com isso, tem-se a associação com cada valor da distribuição. EX: Sabe-se que um aluno alcançou as seguintes notas nas provas de física, português e história, respectivamente, 4,9; 6,3; 7,0. Conhecendo a média e o desvio padrão das notas das três matérias indicadas e sabendo que a distribuição das notas formam uma curva normal, onde esse aluno teve um melhor desempenho. Física: média = 4,5 Desvio Padrão = 1,8 Português: média = 6,8 Desvio Padrão = 1,2 História: média = 6,5 Desvio Padrão = 0,7 Importante: Usar a tabela de probabilidade Normal Probabilidade, Amostragem e Distribuição = 4,9-4,5/ 1,8= 0,22 - FÍSICA 1 2 0,22 0,087 0,500 0,413 Probabilidade, Amostragem e Distribuição = 6,3-6,8/ 1,2= -0,42 - Português -1 -2 -0,42 0,500 0,163 0,337 Probabilidade, Amostragem e Distribuição = 7,0-6,5/ 0,7= 0,71 - História 1 2 0,71 0,500 0,261 0,239 Probabilidade, Amostragem e Distribuição Voltando no caso do teste do QI – z = 2,33 2,33 ? Percentagem da população apresenta escores abaixo de 135? 0,9901 0,0099 Probabilidade, Amostragem e Distribuição O uso da tabela associado ao gráfico da função acumulada da probabilidade, considerando a variável Z. Probabilidade, Amostragem e Distribuição Possibilidades de expressar as probabilidades: P(a < Z < b) = probabilidade de o valor z estar entre “a” e “b”. P(Z < a) = probabilidade de o valor z ser menor que “a”. P(Z > a) = probabilidade de o valor z ser maior que “a”. Probabilidade, Amostragem e Distribuição Probabilidade, Amostragem e Distribuição Como se chegar ao valor da probabilidade? Função densidade da distribuição normal: Função densidade da distribuição normal reduzida: Probabilidade, Amostragem e Distribuição Z=1 Probabilidade, Amostragem e Distribuição Probabilidade, Amostragem e Distribuição Todas as distribuições são NORMAIS? O que fazer quando a distribuição não é NORMAL? TEOREMA DO LIMITE CENTRAL Logo que você nasceu seu pai começou a jogar um dado não viciado e a anotar o resultado. Essa pratica passou para o seu filho, então, primeiramente seu pai e após o seu filho, jogou o dado a cada dois segundos ao longo de 80 anos. Como será representada a distribuição de todos os lances de dados? Supor que a distribuição amostral é sempre igual a distribuição da população? Probabilidade, Amostragem e Distribuição TEOREMA DO LIMITE CENTRAL Distribuição Uniforme ~ Distribuição Normal Probabilidade, Amostragem e Distribuição TEOREMA DO LIMITE CENTRAL Vamos escolher aleatoriamente 10 amostras de 10 lances de dados da população de lances de dados de toda a sua vida 1,5,1,2,6,6,4,1,4,6 = média = 3,6 1,2,2,2,6,5,3,3,6,4 = média = 3,4 4,2,1,6,6,5,3,5,5,2 = média = 3,9 3,5,2,4,2,2,1,4,3,4 = média = 3,0 4,2,1,1,2,6,6,5,3,4 = média = 3,4 6,3,1,2,5,6,1,4,3,3 = média = 3,4 1,1,6,2,4,3,5,2,1,4 = média = 2,9 2,3,4,4,6,1,5,3,2,1 = média = 3,1 3,1,5,4,1,6,6,2,2,3 = média = 3,3 2,3,4,2,6,1,5,2,3,4 = média = 3,2 Probabilidade, Amostragem e Distribuição TEOREMA DO LIMITE CENTRAL EX: A distribuição de probabilidade da variável resultante do lançamento de um dado segue a distribuição uniforme, ou seja, qualquer valor (1,2,3,4,5,6) tem a mesma probabilidade (1/6) de ocorrer. No entanto, se ao invés de lançar um dado, sejam lançados dois dados e calculada a média, a média dos dois dados seguirá uma distribuição aproximadamente Normal. Probabilidade, Amostragem e Distribuição TEOREMA DO LIMITE CENTRAL Probabilidade, Amostragem e Distribuição TEOREMA DO LIMITE CENTRAL Probabilidade, Amostragem e Distribuição TEOREMA DO LIMITE CENTRAL 1,0 1,5 3,5 2,5 2,0 3,0 6,0 4,0 4,5 5,0 5,5 1/36 2/36 3/36 x f(x) 4/36 5/36 6/36 Probabilidade, Amostragem e Distribuição TEOREMA DO LIMITE CENTRAL Executável TLC Probabilidade, Amostragem e Distribuição TEOREMA DO LIMITE CENTRAL A distribuição amostral da média é normal, não obstante a forma de distribuição da população. TEOREMA DO LIMITE CENTRAL: Se são variáveis aleatórias independentes com média e variância , e se e são valores finitos, a distribuição de tende a uma distribuição normal com média e variância , a medida que n cresce, em outras palavras, a distribuição limite de Probabilidade, Amostragem e Distribuição EXEMPLO: 1. Seja X: N(80,26). Dessa população retiramos uma amostra de n = 25. Calcular: Como X: N(80,26) Probabilidade, Amostragem e Distribuição Probabilidade, Amostragem e Distribuição 2. Seja X: N(100,85). Dessa população retiramos uma amostra de n = 20. Calcular: Neste caso a probabilidade já está definida, precisamos determinar o valor Z tal que 0,95 seja a probabilidade de que a média estar entre os dois limites: -Z Z 0 Probabilidade, Amostragem e Distribuição Ou seja: A probabilidade da média amostral pertencer no intervalo acima é de 95%, o que significa que temos uma confiança de 95% (95 para 100) de que, retirada uma amostra de n=20, a média dela estará entre 95,96 e 104,04, ou então há um risco de 5% de que está média seja < 95,96 ou > 104,04 Probabilidade, Amostragem e Distribuição De uma população normal com desvio padrão de 5, retiramos uma amostra de 50 elementos e obtemos uma média de 42 Fazer o intervalo de confiança para a média ao nível de 5% Qual o erro da estimação ao nível de confiança de 5%? Para que o erro seja < ou = 1, com probabilidade de 95%, qual deverá ser o tamanho da amostra? Probabilidade, Amostragem e Distribuição INTERVALO DE CONFIANÇA PARA MÉDIAS E PROPORÇÕES Não obstante, tenhamos conhecimento de que a média da amostra é uma aproximação da média da população, geralmente não temos muita certeza da precisão desta aproximação. Os intervalos de confiança podem nos ajudar nessa dúvida. Estimativa Pontual: a média representa um ponto da variável e por esse motivo não sabemos se a nossa média amostral é uma subestimação ou uma sobrestimação da média populacional. Intervalo de Confiança: fornece um raio de valores em torno da média amostral dentro do qualpodemos, com determinada confiança , se ele contém a média da população. Probabilidade, Amostragem e Distribuição X P(X) 10,1 20,2 30,4 40,2 50,1 S X X Z - = ) 1 , 0 ( ~ N X 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 0 . 8 4 1 3 0 . 8 6 4 3 0 . 8 8 4 9 0 . 9 0 3 2 0 . 9 1 9 2 0 . 8 4 3 8 0 . 8 6 6 5 0 . 8 8 6 9 0 . 9 0 4 9 0 . 9 2 0 7 0 . 8 4 6 1 0 . 8 6 8 6 0 . 8 8 8 8 0 . 9 0 6 6 0 . 9 2 2 2 0 . 8 4 8 5 0 . 8 7 0 8 0 . 8 9 0 7 0 . 9 0 8 2 0 . 9 2 3 6 0 . 8 5 0 8 0 . 8 7 2 9 0 . 8 9 2 5 0 . 9 0 9 9 0 . 9 2 5 1 0 . 8 5 3 1 0 . 8 7 4 9 0 . 8 9 4 4 0 . 9 1 1 5 0 . 9 2 6 5 0 . 8 5 5 4 0 . 8 9 6 2 0 . 9 1 3 1 0 . 9 2 7 8 0 . 8 7 7 0 0 . 8 5 7 7 0 . 8 7 9 0 0 . 8 9 8 0 0 . 9 1 4 7 0 . 9 2 9 2 0 . 8 5 9 9 0 . 8 8 1 0 0 . 8 9 9 7 0 . 9 1 6 2 0 . 9 3 0 6 0 . 8 6 2 1 0 . 8 8 3 0 0 . 9 0 1 5 0 . 9 1 7 7 0 . 9 3 1 9 0 . 0 0 0 . 0 1 0 . 0 2 0 . 0 3 0 . 0 4 0 . 0 5 0 . 0 6 0 . 0 7 0 . 0 8 0 . 0 9 Probabilidade de ocorrência de valores abaixo de Z Z 1 . 0 1 . 1 1 . 2 1 . 3 1 . 4 0 . 8 4 1 3 0 . 8 6 4 3 0 . 8 8 4 9 0 . 9 0 3 2 0 . 9 1 9 2 0 . 8 4 3 8 0 . 8 6 6 5 0 . 8 8 6 9 0 . 9 0 4 9 0 . 9 2 0 7 0 . 8 4 6 1 0 . 8 6 8 6 0 . 8 8 8 8 0 . 9 0 6 6 0 . 9 2 2 2 0 . 8 4 8 5 0 . 8 7 0 8 0 . 8 9 0 7 0 . 9 0 8 2 0 . 9 2 3 6 0 . 8 5 0 8 0 . 8 7 2 9 0 . 8 9 2 5 0 . 9 0 9 9 0 . 9 2 5 1 0 . 8 5 3 1 0 . 8 7 4 9 0 . 8 9 4 4 0 . 9 1 1 5 0 . 9 2 6 5 0 . 8 5 5 4 0 . 8 9 6 2 0 . 9 1 3 1 0 . 9 2 7 8 0 . 8 7 7 0 0 . 8 5 7 7 0 . 8 7 9 0 0 . 8 9 8 0 0 . 9 1 4 7 0 . 9 2 9 2 0 . 8 5 9 9 0 . 8 8 1 0 0 . 8 9 9 7 0 . 9 1 6 2 0 . 9 3 0 6 0 . 8 6 2 1 0 . 8 8 3 0 0 . 9 0 1 5 0 . 9 1 7 7 0 . 9 3 1 9 0 . 0 0 0 . 0 1 0 . 0 2 0 . 0 3 0 . 0 4 0 . 0 5 0 . 0 6 0 . 0 7 0 . 0 8 0 . 0 9 Probabilidade de ocorrência de valores abaixo de Z Z ( ) ï þ ï ý ü ï î ï í ì - - = 2 2 . 2 . . 2 1 ) ( s m p s X e X f ( ) ï þ ï ý ü ï î ï í ì - = 2 2 . . 2 1 ) ( Z e Z f p á r e a = 1 área=0,5 área=0,5 ( ) 1 . . 2 . 1 ) ( 2 2 . 2 = = ò ò ¥ + ¥ - ¥ + ¥ - ï þ ï ý ü ï î ï í ì - - dX e dX X f X s m p s ( ) 5 , 0 . . 2 1 0 2 2 = ò ¥ - ï þ ï ý ü ï î ï í ì - dZ e Z p ( ) 5 , 0 . . 2 1 0 2 2 = ò ¥ + ï þ ï ý ü ï î ï í ì - dZ e Z p á r e a = 1 área=0,5 área=0,5 Área=0,84 1,0 0,84 0,0 ò ¥ - = = £ x dx x f x F x X P ) ( ) ( ) ( { } Tabelado ) ( Þ = þ ý ü î í ì - £ = £ Z F x Z P x X P s m Área=0,84 1,0 0,84 0,0 1 0 dado 2 0 dado Soma Média 1 0 dado 2 0 dado Soma Média 1 1 2 1,0 5 2 7 3,5 1 2 3 1,5 3 4 7 3,5 2 1 3 1,5 4 3 7 3,5 1 3 4 2,0 2 6 8 4,0 3 1 4 2,0 6 2 8 4,0 2 2 4 2,0 3 5 8 4,0 1 4 5 2,5 5 3 8 4,0 4 1 5 2,5 4 4 8 4,0 3 2 5 2,5 3 6 9 4,5 2 3 5 2,5 6 3 9 4,5 1 5 6 3,0 4 5 9 4,5 5 1 6 3,0 5 4 9 4,5 2 4 6 3,0 4 6 10 5,0 4 2 6 3,0 6 4 10 5,0 3 3 6 3,0 5 5 10 5,0 1 6 7 3,5 5 6 11 5,5 6 1 7 3,5 6 5 11 5,5 2 5 7 3,5 6 6 12 6,0 Média de dois dados Freqüência 1,0 1 1,5 2 2,0 3 2,5 4 3,0 5 3,5 6 4,0 5 4,5 4 5,0 3 5,5 2 6,0 1 n n n n n X X X X ,..., , , 3 2 1 m 2 s å = i X Y ( ) m . n Y E = ( ) 2 . s n Y V = n n X Z i . . s m å - = n x Z s m - = ) 83 ( > x P ) 82 ( £ x P î í ì = = = 1 , 5 26 80 s m 80 = x m 02 , 1 25 1 , 5 = = x s 02 , 1 80 - = - = x n x Z s m 02 , 1 80 83 - = Z 94 , 2 = Z 00164 , 0 ) 94 , 2 ( = ³ Z P 02 , 1 80 82 - = Z 96 , 1 = Z 975 , 0 ) 96 , 1 ( = £ Z P 95 , 0 ) . . ( = + < < - x x Z x Z x P s m s a a 96 , 1 475 , 0 = = Z Z a 95 , 0 ) 06 , 2 . 96 , 1 100 06 , 2 . 96 , 1 ( = + < < - x x P 04 , 104 100 06 , 2 . 96 , 1 < Þ < - x x x x < Þ + < 96 , 95 06 , 2 . 96 , 1 100 95 , 0 ) 04 , 104 56 , 95 ( = < < x P
Compartilhar