Baixe o app para aproveitar ainda mais
Prévia do material em texto
MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo ProgramaPrograma do do cursocurso:: Regressão linear simples e correlação. Aplicações de modelos de regressão linear.15 e 16 Prova14 Feriado (4/6)13 Testes não-paramétricos (associação, independência e de aderência).12 Testes de Hipóteses. Inferência baseada em 2 amostras (entre parâmetros de populações distintas).11 Propriedades dos estimadores. Intervalos de confiança (estimação por intervalo). Tamanho da amostra. Princípios de testes de hipóteses.10 Amostras aleatórias. Distribuições amostrais. Teorema do limite central.9 Princípios de estatística. Estimadores e estimativas. Estimação pontual de parâmetros (Métodos dos momentos e da máxima verossimilhança). Estatística Descritiva.8 Prova7 Variáveis aleatórias conjuntas, função distribuição conjunta e marginal. Independência estatística. Covariância e Coeficiente de Correlação.6 Feriado (2/4)5 Principais distribuições de probabilidade contínuas (Exponencial negativa e Normal).4 Valor esperado e variância. Momentos de uma variável aleatória. Função geradora de momentos. Principais distribuições de probabilidade discretas (Bernoulli, Binomial e Poisson).3 Teorema da probabilidade total e teorema de Bayes. Variáveis aleatórias. Distribuições de probabilidade. Funções massa, densidade, e distribuição acumulada. Funções de variáveis aleatórias.2 Introdução à probabilidade (eventos, espaço amostral, axiomas, propriedades, probabilidade condicional e independência).1 ConteúdoSemanas Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo PRINCÍPIOS DA ESTATÍSTICA POPULAÇÃO AMOSTRA PROBABILIDADE ESTATÍSTICA � Em probabilidade assume-se que população em estudo é conhecida � Em estatística, amostras são utilizadas para se chegar a conclusões ProbabilidadeProbabilidade x x EstatísticaEstatística:: Princípios da Estatística: �Em probabilidade estudamos os modelos probabilísticos que auxiliam na redução da realidade: MODELO REALIDADE HIPÓTESES ESTIMAÇÃO DOS PARÂMETROS TESTAR ADERÊNCIA FAZER INFERÊNCIAS EM RELAÇÃO À REALIDADE Princípios da Estatística: �No procedimento descrito: � A REALIDADE é a POPULAÇÃO (totalidade das observações na qual estamos interessados) �Na redução da realidade a HIPÓTESE é que cada observação em uma população é um valor de uma variável aleatória X, com distribuição de probabilidade f(x). Assim, �Quando nos referirmos a uma população f(x) queremos dizer uma população cujas observações são valores de uma variável aleatória que tem uma distribuição de probabilidade f(x) �O valor esperado e a variância da variável aleatória é o valor esperado e a variância da população correspondente Princípios da Estatística: �Objetivo: Fazer inferências em relação à população (caracterizar e eventualmente definir regras de decisão sobre uma população conhecendo apenas parte dela) AMOSTRA POPULAÇÃO HIPÓTESES ESTIMAÇÃO DOS PARÂMETROS TESTAR ADERÊNCIA FAZER INFERÊNCIAS EM RELAÇÃO A POPULAÇÃO Princípios da Estatística: �Def: Amostra é um subconjunto da população. �O processo de amostragem deve assegurar a representatividade da amostra em relação à população de onde foi retirada. �Métodos de amostragem: � Amostragem aleatória: iid � Amostragem estratificada � Amostragem por agrupamentos Princípios da Estatística: �Def: Ao selecionar uma amostra de tamanho n de uma população f(x), define-se a variável aleatória Xi, i =1,…,n, para representar o i-ésimo valor amostral. As variáveis aleatórias X1, X2, …, Xn serão uma amostra aleatória da população f(x), com valores numéricos x1, x2, …, xn se os valores amostrais foram obtidos repetindo-se o experimento n vezes independentemente, sob as mesmas condições. Portanto: � Os Xi’s são independentes � Todas Xi tem a mesma distribuição de probabilidade �Quando as amostras são feitas com reposição ou de uma população “infinita”, essas condições são satisfeitas (as amostras são iid). Princípios da Estatística: �Distribuição de probabilidade de uma amostra aleatória: Como X1, X2, …, Xn é uma amostra aleatória da população f(x), sua distribuição de probabilidade conjunta é Portanto, essa distribuição é caracterizada pelos parâmetros populacionais E[X] e Var[X] que são constantes não afetadas ou influenciadas pelas observações da amostra aleatória. ( ) ( ) ( ) ( )nn xfxfxfxxxf ....,..., 2121 = AMOSTRA POPULAÇÃO HIPÓTESES: f(x) e independência ESTIMAÇÃO DOS PARÂMETROS Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo MÉTODOS DE ESTIMAÇÃO DE PARÂMETROS Métodos de estimação pontual de parâmetros: �Um método de estimação de parâmetros sugere como obter estimadores em casos específicos (quando faz-se alguma hipótese sobre a distribuição da população, por exemplo). �Dois dos métodos mais utilizados em estimação de parâmetros são: � Método da máxima verossimilhança � Método dos momentos Método da máxima verossimilhança: �O MLE é um método para estimação dos parâmetros a partir de uma amostra aleatória proposto por Fisher em 1912. �Def: Função de Verossimilhança: seja X1,…,Xn uma amostra aleatória com f.d.p. conjunta f(x1,…,xn ; θθθθ1,…, θθθθm) em que θθθθ1,…, θθθθm tem valores desconhecidos. Quando x1,…,xn são os valores observados e a f.d.p. conjunta é vista como em função de θθθθ1,…, θθθθm esta é chamada de função de verossimilhança. � Procedimento: a estimativa de máxima verossimilhança de θθθθ1,…, θθθθm são os valores de θθθθi que maximizam a função de verossimilhança. �Por esse método obtém-se os valores de θθθθ1,…, θθθθm que maximizam o valor que torna a amostra observada a “mais provável”. ^ ^ ^ Método dos momentos: �A idéia básica deste método é igualar os parâmetros obtidas a partir das amostras aos parâmetros esperados da população (por exemplo, a média amostral ao valor esperado populacional). �Def: Momento populacional: seja X1,…,Xn uma amostra aleatória de uma população com f.d.p. f(x). Para k=1,2,3,… o k-ésimo momento populacional (ou seja, da distribuição f(x)) éE[Xk]. �Def: Momento amostral: seja X1,…,Xn uma amostra aleatória de uma população com f.d.p. f(x). Para k=1,2,3,… o k-ésimo momento amostral é N X M N i k i k ∑ = = 1 Método dos momentos: � Procedimento: � Seja X1,X2,…,Xn uma amostra aleatória de uma distribuição com f.d.p. f(x;θθθθ1,…, θθθθm), em que θθθθ1,…, θθθθm são parâmetros cujos valores são desconhecidos. � Os estimadores de momento θθθθ1,…, θθθθm são obtidos igualando-se os primeiros m momentos amostrais aos m momentos populacionais correspondentes e resolvendo para θθθθ1,…, θθθθm. ^ ^ Obs: n é conhecido DISTRIBUIÇÃO E[X] VAR[X] m Binomial [X~Bin(n,p)] n.p n.p.(1-p) 1 Poisson [X~Poi(λλλλ )] λλλλ λλλλ 1 Normal [X~N(µµµµ ,σσσσ2)] µµµµ σσσσ2 2 Uniforme [X~Uni(a ,b)] (a +b)/2 (b-a )2/12 2 Exponencial [X~Exp( λλλλ )] 1/λλλλ 1/λλλλ2 1 Gamma [X~Gamma(a ,b)] a .b a .b2 2 Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo ESTATÍSTICA DESCRITIVA Análise exploratória de dados: � Uma vez coletados, é necessário fazer sua análise exploratória com o objetivo de: �Checar sua qualidade (presença de outliers). Formas: � Estatísticas de sumarização (de posição e de dispersão) � Análise gráfica (histograma, box-plot) � A análise exploratória de dados é importante pois além de proporcionar o maior entendimento do problema e dos dados coletados, previne contra erros (conclusões equivocadas). Histograma: - Gráfico de barras contíguas; - Base é proporcional aointervalo da classe; - Área é proporcional a frequência da classe; - Pode-se usar tanto a frequência (ni) como a frequência relativa (fi) �Detecção de outliers Histograma: Medidas de posição: � São utilizadas quando se quer resumir os dados apresentando apenas um ou alguns valores que sejam representativos de toda série. �Média (aritmética): é a soma das observações divididas pelo número delas, ou seja, �Mediana: realização que ocupa a posição central da série de observações, quando estão ordenadas em ordem crescente. ∑ ∑∑ = == === k j jj k j jj n i i Xf n Xn n X X 1 11 em que n é o número de obsevações, x1,...,xn são as observações, nj é o número de informações iguais a xj, fj é a frequência relativa da observação xj. MedianaMédia A comparação entre a média e a mediana indica a assimetria da distribuição. Medidas de posição: �Muito interessante para grande massa de dados. �Menos suscetível a valores extremos (mais indicada que a média em casos de grande dispersão) MEDIANA: Medidas de dispersão: � São utilizadas quando se quer dar informação sobre a variabilidade do conjunto de observações. � Variância: �Desvio padrão: ( ) 1 )( 1 2 2 − − = ∑ = n XX Xs n i i ( ) )( 1 )( 21 2 Xs n XX Xs n i i = − − = ∑ = Quantis e box-plot: � QUARTIS: Q1, Q2, Q3 – Dividem os valores ordenados em quatro subconjuntos com iguais números de elementos. � DECIS: D1, D2, …, D10 – Dividem os valores em 10 subconjuntos. � PERCENTIS:P1,P2, …,P100–Dividem os valores em 100 subconjuntos. Para casa: • Lista de Exercícios 6 (site: www.mec.ita.br/~rodrigo/) • Leitura: Devore – caps. 1 e 6.2 (Métodos de Estimativa Pontual) ou Walpole et al. – caps. 1 e 9.14 (Estimação de MV)
Compartilhar