Baixe o app para aproveitar ainda mais
Prévia do material em texto
Discreta: Idade Quantitativas Contínua: Peso Nominal: Cidade Qualitativas Ordinal: Grau escolaridade Variáveis MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS 1 - MEDIDAS DE POSIÇÃO • Moda Realização mais frequente • Mediana Realização que ocupa posição central da série de observações • Média Aritmética Soma das observações dividida pelo número de observações x fx(x)Me ou x n 1 (x)Me i n 1 i i n 1 i i MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS 2 - MEDIDAS DE DISPERSÃO • Desvio Médio • Variância • Desvio Padrão n/xx)x(DM n 1i i n 1i )x(Vif 2 )xix(n/ n 1i 2 xix)x(VAR )x()x(VAR)x(DP MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS OUTRAS MEDIDAS •Extremos •Quartis, Decis, Percentis São chamadas estatísticas de ordem. Uma medida resistente é aquela pouco afetada por mudanças de uma pequena porção de dados Ex.: A) 5 7 8 10 12 15 Média= 9,5 Mediana= 9 Desvio Padrão= 3,62 B) 5 7 8 10 12 150 outlier Média= 32 Mediana= 9 Desvio Padrão= 57,86 MEDIDAS ASSOCIADAS A VARIÁVEIS QUANTITATIVAS Medidas de Dependência • Variáveis Quantitativas X Y 12 7,2 16 7,4 18 7,0 20 6,5 28 6,6 30 6,7 40 6,0 48 5,6 50 6,0 54 5,5 0 1 2 3 4 5 6 7 8 0 10 20 30 40 50 60 X - Renda bruta mensal em SM Y - % Renda gasta com assistência médica • Coeficiente de Correlação Medidas de Dependência y yy x xx n 1 )y,x(corr i n 1i i )yny()xnx( yxnyx 22 i 22 i ii valoresdeNºn 1y)corr(x,1 Variável Aleatória Discreta EXEMPLO: Duas extrações sem reposição em uma urna contendo 2 bolas brancas e 3 bolas vermelhas. X = V.A. nº de bolas vermelhas 2/5 1/4 B B 3/4 V 3/5 V V B2/4 2/4 Resultados Probabilidade X BB BV VB VV 1/10 3/10 3/10 3/10 0 1 1 2 xi 0 1 2 p(xi) 1/10 6/10 3/10 Valor Esperado V.A. Discreta DENOMINAÇÕES: Valor Esperado, Valor Médio ou Esperança Matemática ii n i xXPxXEX . 1 ii n i xXPXExXVX 2 1 2 Variância Modelos Probalísticos 1) Distribuição de Bernoulli (Discreta) X assume somente dois valores: o valor 1 se ocorresse sucesso e ZERO se ocorresse fracasso x 0 1 p(x) 1-p p p1pXV pXE Modelos Probalísticos 2) Distribuição Binomial (Discreta) Número de sucessos (k) em uma amostra de tamanho n . A amostra é um conjunto de repetições de Bernoulli independentes, onde a probabilidade de sucesso = p p1p.nXV p.nXE kn F...FFF k S...SSS p1pkXP knk n k Modelos Probabilísticos 3) Distribuição Normal (Contínua) Definição X ~ N ( , 2 ) xe 2 1 )x(f 2 2 2 x x f(x) 0 Distribuição Normal Momentos 2XVXE Propriedades • f(x) é simétrica ao redor de x = • x = é o ponto máximo de f(x) • e são pontos de inflexão de f(x) • f(x) 0 quando x Distribuição Normal Conseqüências X Z ~ N (0,1), Z é tabelado Ex.: X ~ N ( = 3, =16) então 4 35 4 3X 4 32 P5X2P 2902,01915,00987,0 5,0Z0P0Z25,0P 2 1 Z 4 1 P nXPnXPxfxf 2,~Se NX 2 Inferência Estatística Objetivo: Fazer afirmações sobre as características de uma população, baseadas em resultados de uma amostra Motivação: É muito dispendioso analisar toda a população Inferência Estatística Problemas Básicos: Teste de Hipótese ou Estimação Exemplo: Lança-se uma moeda 50 vezes e obtém-se 36 caras Teste de Hipótese: A moeda é equilibrada (P=1/2) ou não? Estimação: Qual o valor de P, caso a moeda não seja equilibrada? Inferência Estatística Como selecionar uma amostra? Amostragem Probabilística Utiliza mecanismos aleatórios de seleção de elementos da amostra, atribuindo a cada um deles uma probabilidade a priori Exemplo: amostra casual simples (todos os elementos possuem a mesma probabilidade) Vamos assumir que a amostra é sempre aleatória simples com reposição, que implica em independência entre os elementos Intencional Elementos selecionados com auxílio de especialistas Com Voluntários Os elementos se oferecem como voluntários (teste de remédios) Inferência Estatística Amostragem Estatística É uma característica da amostra onde: amostrada variância 1- 1 amostrada média 1 :. ,, 1 22 1 21 n i i n i i n xx n S x n X Ex xxxfT Inferência Estatística Diferenciação de Notação Amostra X População Característica Amostra População Média Variância No de Elementos Proporção PP Nn S X ˆ 22 Inferência Estatística Distribuição Amostral Propriedade Básica Os elementos da amostra possuem a mesma distribuição dos elementos da população. Distribuição Amostral da Média 2 2 21 i i n XVsendo n XV XEsendoXE n XXX X Onde possui Distribuição Normal se n for suficientemente grande X Inferência Estatística Teorema Central do Limite A soma de variáveis aleatórias independentes e identicamente distribuídas (com média µ e desvio padrão σ) possui Distribuição Normal (com média nµ e desvio padrão σ ) quando o número de variáveis aleatórias é muito grande, Exemplo: Se o valor médio de uma indenização é $ 400 e o desvio padrão $1.000, calcule a probabilidade de que a soma de 85 indenizações, independentes uma da outra, seja superior a $ 49.000. Solução: 30n n 000.3440085 n 220.985000.1 n %15,5)63,1(1) 220.9 000.34000.49 (1)000.49( ZPZPSP Inferência Estatística Distribuição Amostral da Média Propriedades nNX N n X Z /,0~ 1,0~ / 2 I - II - Inferência Estatística Distribuição Amostral da Média Exemplo %9522502498 1,500~ Logo pesados são pacotes os e 100 amostra uma se-Tira 100,500 ~ onde máquina uma por enchidos pacotes de peso .. 2 ZPXP XVXENX n NX AVX Logo, caso os 100 pacotes apresentem uma média fora desse intervalo, é bem provável que a máquina esteja desregulada. Inferência Estatística Distribuição Amostral da Proporção A proporção de elementos portadores de uma certa característica é P PnBINSSP P XXXS S X nn nn n ,~e/nˆ amostra.na ticacaracterísda portadores elementos de Proporçãoˆ amostra na tica caracterísda portadores indivíduos de Total - contrário caso 0 ticacaracterísa possui elemento o se 1 21 Inferência Estatística Distribuição Amostral da Proporção n PP n PPn SV n PV P n nP n SE PE n n 111ˆ ˆ 22 Onde possui DistribuiçãoNormal se n for suficientemente grande Pˆ Inferência Estatística Determinação do Tamanho de uma Amostra Exemplo: Suponha que em uma população no mínimo 60% das pessoas preferema a marca A. Se quisermos que o erro amostral de seja menor do que 0,03, com probabilidade maior do que 95%, então o tamanho da amostra será: Pˆ nNX /,0~ 2 )( XP Z n 2 22 Z n 024.1 )03,0( )4,0)(6,0()96,1( 2 2 n Estimação Propriedades dos Estimadores 1) Estimador Não Viciado A média do estimador é igual ao próprio parâmetro Exemplo: O estimador é não viciado, pois: i n XEsendoXE n XXX X 21 X Estimação Propriedades dos Estimadores 1) Estimador Não Viciado O estimador é viciado, pois Pode-se demonstrar, então, que o estimador é não viciado 2 1 2 )( 1 ˆ XX n n i i 2 1 2 )( 1 1 XX n S n i i 22 1)ˆ( n n E Estimação Propriedades dos Estimadores 2) Estimador Consistente Quando o número de observações tende para infinito, a variância do Estimador tende para zero Exemplo: O estimador é consistente, pois 2 2 iXVsendo n XV n XXX X n 21 Estimação Propriedades dos Estimadores 3) Estimador Eficiente Um estimador é mais eficiente quando a sua variância é inferior à de outro estimador Estimação Intervalos de Confiança O uso de um estimador pontual T de um parâmetro não permite determinar a magnitude do erro. Para tal são construídos intervalos de confiança com coeficiente de segurança baseados na distribuição amostral do estimador pontual. Ou seja: E o intervalo de confiança é denotado da seguinte forma: )( 21 ttP 21 ,);( ttIC Estimação Intervalos de Confiança IC para a média µ Sabemos que: Ou seja, 1,0~ / N n X Z nNX /,0~ 2 )( / )( z n X zP nzXnzXP /)(/)( Inferência Estatística IC para a média µ Exemplo: Seja a máquina do exemplo anterior desregulada e com a mesma variância. Em uma amostra de n=100 observou-se = 450. Qual o intervalo de valores para a média com 90% de probabilidade? %90645,1450645,1450 %90645,1645,1 1,0~1,0~ / 1/101002 P XP NXN n X n Logo µ estará entre 448,4 e 451,6 com 90% de probabilidade Intervalos de Confiança X Estimação Intervalos de Confiança IC para a proporção P Sabemos que possui Distribuição Normal se n for suficientemente grande e que: Ou seja, Onde P pode ser substituído pela sua estimativa PPE ˆ Pˆ n PP PV 1ˆ )( /)1( ˆ )( z npp PP zP nppzPPnppzPP /)1()(ˆ/)1()(ˆ Pˆ Inferência Estatística IC para a proporção P Exemplo: Numa pesquisa de mercado, n = 400 pessoas foram entrevistadas sobre determinado produto, e 60% delas preferiram a marca A. Dado um coeficiente de confiança de 95%, determine um intervalo de confiança para a proporção da população P. Sabemos que 96,1)( z Logo P estará entre 0,552 e 0,648 com 95% de probabilidade Intervalos de Confiança 6,0ˆ P 95,0 95,0400/4,06,096,16,0400/4,06,096,16,0 PP 95,0648,0552,0 PP Estimação Erro Padrão de Estimação O erro padrão de um estimador T corresponde à raiz quadrada da variância de T, ou seja, Ex: Podemos usar no lugar do o desvio padrão amostral S e no lugar de P o estimador amostral )()( TVARTEP n XEP )( n PP PEP )1( )ˆ( Pˆ Testes de Hipóteses Objetivo O objetivo de um teste de hipótese é fornecer uma metodologia que nos permita verificar se os dados amostrais trazem evidências que apóiem ou não uma hipótese formulada. Normalmente se testa a hipótese para um parâmetro populacional Testes de Hipóteses Procedimento Geral Existe uma variável X associada a dada população e tem-se uma hipótese sobre determinado parâmetro dessa população. Por exemplo, afirmamos que o verdadeiro valor de é . Colhe-se uma amostra aleatória de elementos dessa população, e com ela deseja-se comprovar ou não tal hipótese ( ), chamada de hipótese nula. Em seguida formula-se uma hipótese alternativa, a qual será considerada aceitável, caso a hipótese nula seja rejeitada. Exemplos: ou ou 0 00 : H 01 : H01 : H 01 : H Testes de Hipóteses Erros no Teste de Hipótese Erro tipo I: Rejeitar a hipótese nula quando essa é verdadeira. Erro tipo II: não rejeitar a hipótese nula, quando ela é falsa )/( 00 verdadeiraéHHrejeitarP )/( 00 falsaéHHrejeitarP Testes de Hipóteses Passos Para a Construção 1) Fixar a hipótese nula e a alternativa 2) Decidir qual estimador será usado par testar a hipótese nula 3) Definir a probabilidade do erro tipo I e utilizar este valor para construir uma região crítica (regra de decisão) 4) Usar as observações da amostra para calcular o valor da estatística do teste 5) Se o valor da estatística calculado com os dados da amostra não pertencer à região crítica, não rejeite 0H 1H Testes de Hipóteses Exemplo Teste da Média com Variância Conhecida Uma máquina de encher pacotes de café enche-os de acordo com uma distribuição Normal com e variância igual a . Desejamos, periodicamente, colher uma amostra de 16 pacotes e verificar se a produção está sob controle, isto é, se ou não. Se uma dessas amostras apresentar uma média , você pararia ou não a produção para regular a máquina, dado que ? g500 2400g g500 gx 492 %1 gH gH 500: 500: 1 0 Testes de Hipóteses Exemplo Teste da Média com Variância Conhecida , logo a média de 16 pacotes terá distribuição: onde A região crítica para não aceitar a hipótese nula é seguinte: Sendo: Logo, e e a hipótese nula não é rejeitada, pois a média observada 492 não pertence à região crítica. Ou seja, o desvio da méda da amostra para a média proposta pela hipótese nula pode ser considerado como devido apenas ao sorteio aleatório dos pacotes. )2516/400,500(~ 2 NX 4002 )1,0(~ 5 500 N X }{ 21 cc xxouxxRC X 58,25/)500( 1 cx 1,4871 cx 9,5122 cx 58,25/)500( 2 cx Testes de Hipóteses Exemplo Teste Para Proporção Uma estação de TV afirma que 60% dos televisores estavam ligados no seu programa de Segunda Feira. Uma estação competidora deseja contestar essa afirmação e decide usar uma amostra de 200 famílias e observou que 104 famílias estavam assistindo ao programa. Você afirmaria que a audiênica é realmente de 60%, dado que . Neste caso, a hipótese nula é a seguinte: Se esta hipótese não for verdadeira, espera-se uma proporção menor. A estação divulgaria o máximo possível, logo a hipótese alternativa é: %5 60,0:0 pH 60,0:1 pH Testes de Hipóteses Exemplo Teste para Proporção A proporção obtida de 200 famílias possui distribuição distribuição: onde A região crítica para não aceitar a hipótese nula é seguinte: Sendo: Logo, e a hipótese nula é rejeitada, pois a proporção que foi observada pertenceà região crítica. Ou seja, há evidências que a audiência do programa de Segunda Feira não foi de 60% e sim inferior. )0012,0200/4,06,0,6,0(~ˆ 2 Np )1,0(~ 0012,0 6,0ˆ N p }ˆˆ{ cppRC pˆ 645,10012,0/)6,0ˆ( cp 544,0ˆ cp 52,0200/104ˆ p
Compartilhar