Baixe o app para aproveitar ainda mais
Prévia do material em texto
HISTÓRIA FINITA INFINITA RECENSEAMENTO SONDAGEM METODOLOGIA DA PESQUISA CIENTÍFICA INTRODUÇÃO POPULAÇÃO OU UNIVERSO ESTATÍSTICO AMOSTRA CLASSIFICAÇÃO ESTATÍSTICA Profº. Marcelo Leão BIOESTATÍSTICA • CONCEITO • Bioestatística • É um conjunto de técnicas ou processos que permite observar, descrever numericamente e analisar fatos numéricos nas ciências da vida, ou seja, é a Estatística Médica. • A Estatística pode ser uma ciência, mas nós a trataremos como um instrumento auxiliar a todas as ciências, pois não possui um objetivo próprio, por isso pode ser usada por qualquer pessoa que saiba manipular números: médico, enfermeiro, fisioterapeuta, psicólogos,etc. • Aplicações • - Nascimentos, óbitos e perdas fetais; • - Doenças; • - Serviços; • Disciplina: Bioestatística Carga Horária: 54 h/a • Ementa: Introdução à Estatística. Estatística na área da saúde. Descrição, Exploração e Comparação de Dados. Probabilidade. Distribuições de Probabilidade. Tipos de erros. A distribuição normal de Probabilidade. Inferência Estatística. Estatística e projetos científicos. • Bibliografia Básica: • VIEIRA, S. Introdução à Bioestatística, 3ª ed. Rio de Janeiro, Ed. Campus, 1980. • COSTA NETO, P. O. Estatística. 2ª ed. São Paulo: Edgard Blücher, 2002. • JEKEL J. FIELMORI J.G. KATZ D.L. Epidemiologia, Bioestatística e Medicina preventiva. 2ª ed. Porto Alegre: Artmed, 2005. • CALLEGARI-JACQUES, SM. Bioestatística: princípios e aplicações. 2003 • Bibliografia Complementar: • MORETTIM, P. A & BUSSAB, W. Estatística Básica. 4ª ed. São Paulo: Atual, 1985 • FONSECA, J. S.; MARTINS, G. A; TOLEDO, G. L. Estatística Aplicada. São Paulo: Atlas, 1995. • CUTLER, Paul. Como Solucionar Problemas em Clínica Médica: dos Dados ao Diagnóstico. 3ª ed. Guanabara Koogan, 1999. • TOLEDO, Geraldo Luciano. Estatística Básica. 2ª ed. São Paulo: Atlas, 1999. Coleta de Dados É a parte operacional, ela é utilizada de varias maneiras, porém a mais utilizada é através de questionários e entrevistas. Em ambos os casos as perguntas devem ser claras, curtas e objetivas e com linguagem de fácil compreensão. Formas de coletas de dados. Coleta Direta. Continua: quando os dados são obtidos ininterruptamente, automaticamente e na vigência de um determinado período, ou seja, um ano. Ex relatório diário da produção. Periódica: Quando realizada em períodos curtos, determinados, de tempo em tempos; Ex: a manutenção periódica de uma máquina. Ocasional: Quando os dados forem colhidos esporadicamente, Ex: A coleta no caso da dengue. Coleta Indireta Indireta: É quando é inferida a partir dos elementos conseguidos pela coleta direta ou através do conhecimento de outros fenômenos. Ou seja é feita por dedução e conjunturas . Apuração dos Dados Consiste em resumir os dados, através de sua contagem e agrupamento é o trabalho de tabulação dos dados que chegam ao analista, de forma desorganizada. PARÂMETROS X ESTATÍSTICA Normas para apresentação dos dados Apresentação Tabular : consiste em dispor os dados em linhas e colunas distribuídas de modo ordenado. Elemento de uma Tabela Titulo : Um titulo deve responder as seguintes perguntas: O que ? ( assunto a ser representado) ( Fato ) Onde ? ( O lugar onde ocorreu o evento ) ( Local ) Quando ? ( a época do evento) ( Tempo ) Corpo: É a parte da tabela composta por linhas e colunas. Fonte : Refere-se a entidade que organizou ou forneceu os dados expostos. SÉRIES ESTATÍSTICAS TIPOS DE ESTATÍSTICA ESTATÍSTICA DESCRITIVA: É a coleta de dados numéricos, a organização , classificação desses dados, e a sua apresentação através de gráficos e tabelas, permitindo descrever resumidamente os fenômenos. Estatística Indutiva : É a coleta de dados através de uma amostra para obter e generalizar conclusões, ou seja inferir propriedades para o todo ( população) com base na (amostra ). Variável : É uma característica comum que pode assumir valores ou modalidades diferentes, de individuo para individuo. Tipos de Variável Variável Discreta : São variáveis que resulta seus valores através de números inteiros não negativos. Ex: Número de filho dos alunos do curso de psicologia. Variáveis Continuas : São variáveis que assumir teoricamente qualquer valor em um certo intervalo, ou seja é uma variável continua. EX : O peso dos alunos de psicologia. 50,4 ; 62,3 ; 80,1; 73,7. CLASSIFICAÇÃO DAS VARIÁVEIS Variáveis Quantitativas : São quando os valores são representado por números. ex :Nº de filhos, idade, renda familiar etc. Variáveis Qualitativas : São quando são apresentadas por varias qualidades ou atributos. Ex : Sexo, Religião , formação escolar. Níveis de Mensuração Nível nominal: É o ato de nomear , rotular ou classificar um objeto, pessoa ou alguma característica, por meio de números ou símbolos . Ex : Religião de cada estudante para compor determinada amostra. Católico 1 Judeu 2 Protestante 3 Nível Ordinal : É a variável que pode assumir várias categorias ou atributos mantém uma relação de ordem do menor para o maior. Ex : Nível de instrução do chefe da família. Analfabeto 1 Fund menor 2 Fund Maior 3 Ens Médio 4 Nível intervalar : São variáveis que assumem varias categorias que mantém uma relação de ordem além de intervalos iguais de medição. EX : Altura dos alunos de psicologia em (cm ). ( ) 1,50 a 1,59 ( ) 1,60 a 1,69 ( ) 1,70 a 1,79 ( ) 1,80 a 1,89 Método Estatístico Definição do problema : Além de definir o problema a ser objeto de estudo, o analista deverá examinar outros levantamentos realizados no mesmo campo, uma vez que parte das informação que necessita pode muitas vezes,já estar disponível. Planejamento : Ele deverá ter o máximo de informes com um mínimo de custo e tempo ou seja : 1º Que dados deverão ser obtidos 2º Como se deve obtê-los 3º Em que setor geográfico deverá ser feita a pesquisa 4º Qual o grau de precisão exigido 5º censo ou amostragem 6º Cronograma da atividade 7º custo envolvido Apresentação dos Dados Apresentação Tabular Construção de uma Distribuição de Freqüência Dados brutos : São as informações que não estão numericamente organizadas, logo não se encontrão prontas para análise. Rol ou Lista : É uma lista em que os valores estão em ordem crescente ou decrescente. Amplitude Total ou Range ( R ) : È a diferença entre o maior e o menor valor da amostra. Logo : R = Xmáx - Xmin Número de classe (K ) : Determina o número de classe ou intervalo quais a amostra deverá se dividida; logo: K = 1+ 3,22.log n Tamanho do intervalo de classe ( h ) : O tamanho é dado por : h = R / K Freqüência absoluta (fi ): É o número de vezes que o elemento ocorre na amostra.Obs : O somatório das freqüências absolutas é igual ao número de elementos da amostra, ou seja, somatório fi = n . Freqüência relativa ( fr ) : É o quociente entre as freqüências absolutas de cada classe e o numero total de observações. logo , fr = fi /n. Freqüência acumulada(fac) : é o acumulo das freqüências absolutas. Apresentação Gráfica Gráficos com dados numéricos Disposição Ramo e Folha : É uma contagem de freqüência utilizando os últimos algarismo . Histograma : É um gráfico formado por um conjunto de retângulos justapostos de forma que a área de cada retângulo seja proporcional á freqüência da classe que ele representa. Polígono de Freqüência : É formado deixando-se ponto médio de cada classe representa-lhe os dados e depois conectá-los a seqüencia de pontos médios em seus respectivos percentuais de classe. Polígono de Freqüência Acumulada : Tem por finalidade a representação da freqüência acumulada. Gráficos de Dados Categorizados Gráficos de barras ou colunas : Têm por finalidade comparar grandezas por meio de retângulos de igual largura e alturas proporcionais às suas respectivas grandezas. Gráfico de setor , pizza ,circular ou ciclograma : São usados para representar valores absoluto ou ponderados em porcentagem; a área total do gráfico equivale a ( 360° = 100 % ) . Gráfico Pictograma : Tem por objetivo despertar a atenção do público em geral muito desses gráficos apresentam grande dose de originalidade e de habilidade na apresentação de dados. Medida de Tendência Central Def : São medidas que dão o valor do ponto em torno do qual os dados se distribuem ou seja é um resumo de informações. EX : Média Aritmética Simples: é a média que é igual ao quociente entre a soma dos valores do conjunto e o número total dos valores. Obs : este tipo de média é utilizado quando os valores não estão tabulados ou sejam quando aparecem representados individualmente. Logo : X = Σxi / n Ex: Um engenheiro verifica a produção diária de uma tipo peça que dez operários produzem : 8,9,5,6,3,5,7,8,8,4. então a média será: Média Aritmética Ponderada: É a média cujo os valores do conjunto tem peso diferentes ou seja é o quociente entre o produto dos valores da variável pelos respectivos pesos e sua soma. Logo : X = Σxi.fi / n Moda P/valores Simples : É o valor mais freqüente quando comparado sua freqüência com a dos valores de um conjunto ordenado. Existe três tipos de moda: Unimodal : Quando a amostra possuir uma única moda. Ex : Bimodal : Quando a amostra possuir duas modas. Ex : Plurimodal : Quando a amostra possuir mais de duas modas. Ex: Moda P/ valores Agrupados : Para dados agrupados utilizamos a fórmula de czuber 1º passo : identificar a classe amodal. 2º passo : Aplicar a fórmula de czuber : X = limf + (Δ1 /Δ1 +Δ2) .h OBS: delta 1 = fabs – fant , delta 2 = fabs – fpost , linf = limite inferior da classe amodal. Mediana : É o valor que divide uma série ordenada pelo menos a metade ou cinqüenta por cento dos elementos amostrais sejam iguais ou maiores do que ela. Calculo da mediana P/ valores simples : Quando o numero de observações é impar : Emd = (n+1 / 2 ). Ex : Quando o numero de observações é par : 1º passo : Emd = n / 2 , Emd = ( n / 2 ) +1 , 2º passo : localizar os valores na amostra e calcular a média. Ex : Mediana P/ valores agrupados : 1º passo : localizar a mediana calculando elemento mediano. Emd = n / 2. 2º passo : Calcular a mediana utilizando a fórmula. X = linf + (( n/2) – fant). H / fmd. OBS : linf = limite inferior da classe da mediana; n / 2 = elemento mediano fant = freqüência acumulada anterior da classe da mediana. fmd = freqüência absoluta da classe da mediana; h = intervalo de classe Medida de Dispersão • Def : São medidas utilizadas para avaliar o grau de variabilidade, ou dispersão, dos valores em torno da média. Ser para medir representatividade da média. EX : Representação gráfica • Amplitude Total : è a diferença entre o maior e o menor valor da série. Logo: R = Xmáx – Xmin. • Σ I Xi – X I. f • Desvio Médio : é a medição dos dados em relação a média. Logo : DM = n • Obs : Os desvios foram considerados em módulo, evitando assim que a soma fosse nula. • Variância : È o somatório do quadrado de cada desvio multiplicado pela freqüência absoluta dividido pelo nº de elementos. Logo : σ2 = Σ I Xi – X I2. f e • S2 = Σ I Xi – X I2. f N • n - 1 • Onde σ2 : é a variância populacional e lê-se sigma, e S2 : é a variância amostral. • • Desvio Padrão : é a raiz quadrada da variância . Logo : σ = σ2 e S = S2 Coeficiente de correlação • Diagrama de Dispersão : é o estudo do comportamento conjunto de duas variáveis quantitativas ( x, y ). • Tipo de relação entre duas variáveis • Correlação positiva: é quando uma variável cresce e a outra em média também cresce. • Correlação Negativa : é quando uma variável cresce e a outra em média diminui. • Correlação Perfeita Positiva : São quando as duas variáveis crescem juntas ,e o digrama de dispersão mostra pontos sobre a reta. • Correlação Perfeita Negativa : é quando uma variável cresce e a outra decresce, mais os pontos , no diagrama de dispersão, ficam sobre a reta. • Correlação Não Linear : São quando os pontos não estão sobre a reta nem entorno dela. • Correlação Nula : é quando as duas variáveis não estão relacionadas, ou seja quando os pontos estão muito dispersos. Coeficiente de correlação Tipos de relação entre duas variáveis Correlação Positiva Correlação perfeita Positiva Correlação Negativa Correlação perfeita Negativa Correlação Não linear Correlação Nula Coeficiente de correlação • Def: é a medição do grau de correlação linear entre duas variáveis; Esse coeficiente varia entre -1 e +1. • Quanto mais próximo de -1 estiver o valor do coeficiente de correlação, maior será a correlação negativa entre as variáveis. • Quanto mais próximo de +1 estiver o valor do coeficiente de correlação , maior será a correlação positiva entre as variáveis. • O coeficiente de correlação é indicado por r e calculado por meio da fórmula : • Σ X Y - 1/n Σ X Σ Y • R = • [ Σ X2 - 1/n ( Σ X)2 ] [ Σ Y2 - 1/n ( Σ Y)2 ] • Ex : Regressão Linear • Assim como num estudo de correlação, a análise de regressão também parte de um conjunto de observações pareadas (x1, y1), (x2, y2) ,.......(xn, yn), relativas às variáveis X e Y. Contudo, os pontos não estão exatamente sobre uma reta, provavelmente por causa da existência de fatores não controláveis no processo. • Método dos Mínimos Quadrados • Para construção , precisamos obter estimativas para a partir de um conjunto de observações ( x1, y1), (x2, y2),.....,(xn,yn). Ou seja , queremos encontrar a reta que passe o mais próximo possível dos pontos observados. • A chamada equação da reta de regressão é dada por Y = a + bx , onde a e bsão • Σ Yi – b Σ Xi n. Σ ( Xi.Yi ) – ( Σxi ) ( ΣYi ) • a = n e b = n.ΣXi2 - ( Σ Xi )2 • A diferença entre os valores observados e os preditos é chamado de resíduos: ei = yi – y^. O resíduo relativo é considerado erro aleatório. • Y ------------------------- ei Yi ------------------------- y = a + bx • Ex : No quadro ( Exercício ) • X Introdução à Teoria das Probabilidades • Espaço Amostral : é o conjunto de todos os possíveis resultados do experimento; E é denotado pela letra grega ômega Ω. • Ex : Lançamento de um dado e observação da face voltada para cima: Ω.= [ 1,2,3,4,5,6 ] . • Ex : A observação do diâmetro, em mm, de um eixo produzido em uma metalúrgica Ω.= [ d, tal que d > 0 ] . • Evento : é qualquer subconjunto do espaço amostral : A é um evento → A estar contido em Ω. • Ex : Seja o experimento do lançamento de um dado. Temos : Ω.= [ 1,2,3,4,5,6 ] . São exemplos de eventos: • A = Número par do dado = [ 2,4,6 ] . • B = número maior que 2 do dado = [ 3,4,5,6 ] • C = Número 6 = [6 ] . • OBS : Dizemos que um evento ocorre quando um dos resultados que o compõem ocorre. • Definição Clássica de probabilidade : • Se um experimento aleatório tem n resultados igualmente prováveis, e nA desses resultados pertencem a acerto evento A, então a probabilidade de ocorrência do evento A será: P(A) = nA/ n Probabilidade Condicional e Independência • Def : É a probabilidade de ocorrência de A condicionada à ocorrência prévia de B. Essa probabilidade é representada por p(A / B ) ( Lê-se probabilidade de A dado B). • Ex : Os dados, a seguir representam o sumário de um dia de observação em um posto de qualidade, em que se avalia o peso dos pacotes de leite produzido num laticínio. Condição do peso Tipo do leite B (B) C ( C) UHT (U) Total Dentro das Especificações (D) 500 4500 1500 6500 Fora das especificações (F) 30 270 50 350 Total 530 4770 1550 6850 • Retira-se , ao acaso , um pacote de leite da população de 6850 unidades .Seja D e F os eventos que representam se o pacote retirado está dentro ou fora das especificações, respectivamente. Da mesma forma , B C e U são eventos que representam o tipo do leite. Pergunta-se: • a) Qual é a probabilidade de o pacote de leite estar fora das especificações? • P( F) = 350 / 6850 = 0,051 • B) Qual a probabilidade de o pacote de leite retirado estar fora das especificações, sabendo-se que é do tipo UHT ? • P( F/ U) = 50 / 1550 = 0,032 • Se o numerador de p( F/U) forem divididos pelo número total de unidades, temos: P (F/U) = 50/1550 = ( 50/6850) / (1550/6850) = P(F∩U) / P(B) que é a relação usada na definição formal de probabilidade condicional. Regra do Produto • Def : a regra é obtida ao isolar a probabilidade da interseção. Ou seja : • P(A / B) = P ( A ∩ B ) / P(B) = P (A ∩ B ) = P(B). P(A / B) , que fornece uma fórmula de calcular a probabilidade de ambos os eventos ( A e B) ocorrerem. O evento condicionado é B, mas o inverso também é possível, pois • P(B / A) = P ( B ∩ A ) / P(A) = P (B ∩ A ) = P(A) . P(B / A) • Para três eventos, A, B e C, a regra do produto pode ser escrita como • P(A ∩ B ∩ C ) = P(A) . P ( B/A ) . P ( C/ A ∩ B) • OBS : É importante que seja observada a seq6uência lógica dos eventos para montar as expressões precedentes. • Ex :Uma caixa contém 4 cartões amarelos e 8 vermelhos. Retiramos ao acaso, 2 cartões, um após o outro, sem reposição, e observamos as cores dos dois cartões. • a) Qual a probabilidade de que ambos sejam amarelos ? • b) Como alocar probabilidades a todos os elementos do espaço amostral? • c) Qual é a probabilidade de ocorrer exatamente 1 cartão amarelo? • d) Considere a retirada de 3 cartões . Qual é a probabilidade de que os dois primeiros sejam vermelhos e o terceiro seja amarelo? Eventos Independentes • Def : Dois ou mais eventos são independentes quando a ocorrência de um dos eventos não influencia a probabilidade da ocorrência dos outros. • È uma amostragem feita com reposição.verifique que os cálculos tornam –se mais simples, pois a configuração da urna não se altera na segunda extração. • EX : Uma caixa contém 4 cartões amarelos e 8 vermelhos. Retiram se ao acaso, 2 cartões da caixa, um após o outro, sendo que o primeiro cartão é reposto antes da retirada do segundo ( amostragem com reposição ) , e observa-se a cor dos dois cartões. • Relação de Eventos Independentes • A e B são independentes : P ( A ∩ B ) = P ( A ) . P ( B) • Ampliação de Eventos Independentes • E1, E2......En são independente : P( E1 ∩ E2∩......∩En) = P( E1) . P( E2) .....P ( En) TEOREMA DA PROBABILIDADE TOTAL • Def : É uma medida de peso de cada um dos eventos Ei, na contribuição para formar o evento F. • Usando a regra do produto, temos a seguinte equação, conhecida como o teorema da probabilidade total : • P ( F) = Σ P( Ei) . P( F/ Ei ) • OBS: Naturalmente, algumas P( F/ Ei) poderão assumir valor zero por não haver interseção entre F e Ei. • Ex: Os eventos Ei representam as procedências das peças (fornecedores 1, 2, 3 e 4 ) , e o evento F representa peça não uniforme. Repare que os eventos Ei ( fornecedores) são mutuamente exclusivos, pois a peça somente pode ser originária de um dos fornecedores; e que o evento F tem interseção com cada um deles ( uma vez que todos os fornecedores produzem peças não conformes). • Suponha a mesma probabilidade para todos os fornecedores, isto é, • P( E1) = P(E2) = P(E3) = P(E4) = 0,25 e as probabilidades de não-conformidade para cada fornecedor sejam: P1 = P(F/E1) = 0,1 ; P2 = P(F/E2) = 0,1 ; P3 = P(F/E3) = 0,2 • P4 = P(F/E4) = 0,4 então : • P(F) = (0,25) (0,1) + (0,25) (0,1) + (0,25) (0,2) + (0,25) (0,4) = 0,20. TEOREMA DE BAYES • Permite obter a probabilidade de que um dos eventos Ei ocorra, sabendo-se que o evento F ocorreu. Supõem as mesmas condições ( eventos Ei mutuamente exclusivos e exaustivos e um evento F qualquer). • Logo usado a regra do produto , escrevemos o Teorema de Bayes como : • • P(Ei/F) = P(Ei) . P(F/Ei) / P(F) • Ex : ( continuação do ex: anterior) Sabendo-se que a peça é não conforme, qual é a probabilidade de que ela tenha vindo do fornecedor 4? • P ( E4/F) = P(E4) . P(F/E4) / P(F) = ( 0,25) ( 0,40) / 0,20 = 0,50 DISTRIBUIÇÕES DE PROBABILIADES PARA VARIÁVEIS DISCRETAS. • Distribuição Binomial : é uma distribuição de probabilidade adequada aos experimentos que apresentam apenas dois resultados ( sucesso ou fracasso).Este modelo fundamentam-se nas seguintes hipóteses: • H1. n provas independentes e do mesmo tipo são realizadas • H2. cada prova admite dois resultados – sucesso ou fracasso. • H3. a probabilidade de sucesso em cada prova é p e de fracasso 1- p = q. • Define-se a variável Y como o número de sucesso das n provas. Logo , Y pode tornar os valores 0,1,2,3,.........,n. • n • Então a expressão geral da distribuição Binomial é: P ( Y = y ) = Y P y .q n-y • Porem sua média é: μ(x) = n.P • suavariância é: σ2(x) = n.P.q • E seu desvio é: σ(x) = √ λt • Ex: DISTRIBUIÇÃO DE POISSON • Em muitos casos, conhece-se o número de sucessos, se torna difícil e ás vezes, sem sentido, determinar o número de fracassos ou o número total de provas. Por exemplo: Automóveis que passam numa esquina. Pode-se num determinado intervalo de tempo anotar o número de carros que passaram porém, o número de carros que deixaram de passar pela esquina não poderá ser determinado. • Analisando e o exemplo acima, verifica-se que há uma variável t e quando t→∞ a probabilidade tende a aumentar. • Para encontrar a expressão que dá a probabilidade de x sucesso num intervalo t, algumas hipóteses precisam ser admitidas: • H1. P( X = 1, Δt) = λ Δt • H2. P( X >1 , Δt) = 0 • H3. P( X = 0, Δt ) = 1 - λ Δt • H4. As ocorrências de sucessos em intervalos são independentes • Para encontra a expressão que dá P(x,t) , ou seja a probabilidade de x sucessos no intervalo t, pode-se calcular o limite de uma distribuição binomial . • Portanto: P(x, t) = (( λt )X / X! ) . е -λt • Média : λt • Variância : λt • Desvio padrão: √ λt Distribuições Contínuas de Probabilidade • Def : É a mais importantes distribuição de probabilidade, sendo aplicada em inúmeros fenômenos e utilizada para o desenvolvimento teórico da estatística. • É também conhecida como distribuição de Gauss,Laplace ou Laplace- Gauss. • Distribuição Normal Padrão • É conhecida como distribuição normal padronizada ou reduzida. • Seja Z uma variável aleatória tal que: Zi = Xi - µ / σ , em que X é uma variável normal de média µ e variância σ2 . • Uso da Tabela de Distribuição Normal padrão • Há vários tipos de tabelas que oferecem as áreas ( probabilidades) sob a curva normal padrão. O tipo mais freqüente é a tabela de faixa central. • A tabela de faixa central dá a área sob a curva normal padrão entre z = 0 e qualquer valor positivo de Z. a simetria em torno de z = 0 permite obter a área entre quais quer valores de z ( positivo ou negativos). • Gráfico • Ex : Estimador ou Estatística • Dada uma amostra aleatória, estimador ou estatística é qualquer variável aleatória função dos elementos amostrais. Ou seja: • ^Θ = f ( X1, X2,..........,Xn) é um estimador de Θ . • Observe que a definição é extremamente elástica, permitindo que qualquer combinação das variáveis amostrais ( X1, X2,.....Xn) seja um estimador. • Obs: As medidas de posição , dispersão e assimetria são exemplo de estimadores. • Estimativa • O valor numérico de um estimador é conhecido como uma estimativa. Assim, x = 17,8 é uma estimativa da média populacional µ. Inferência ou indução estatística • Trata-se do processo de obter informações sobre uma população a partir de resultados observados na amostra. • De modo geral tem-se uma população com grande número de elementos, e deseja-se, a partir de uma amostra dessa população, conhecer “ o mais próximo possível” alguma características da população. • Seja X uma das variáveis da população que se deseja estudar. Seja θ uma característica ( medida) de X que se quer conhecer. Esse “conhecimento” de θ se dá pela construção de um estimador ^θ que revelará o valor mais aproximado θ a partir dos elementos amostrais. Assim: • Pop (N) Amostra (n) • inferência ou indução estatística • Intervalo de Confiança • Trata-se de uma técnica para se fazer inferência estatística.Ou seja , a partir de um intervalo de confiança, construído com os elementos amostrais, pode-se inferir sobre um populacional. • A construção de intervalos de confiança fundamenta-se nas distribuições amostrais. Sua lógica é a seguinte: • Seja θ um parâmetro populacional. • Seja θ^ um estimador de θ. • Conhecida a distribuição de probabilidade de θ^ , é possível construir um intervalo: • θ^ ≤ θ ≤ θ • que contém θ, e se exigir que a probabilidade do intervalo seja de ( 1 – α ) = nivel de confiança. • Geralmente ( 1 – α ) 100 = 90%; 95%; 99%........ • Esta técnica diferencia-se da estimação “por ponto “ , onde se calcula um único valor ( estimativa) para o parâmetro populacional. No caso do intervalo de confiança busca-se um seguimento, ou intervalo θ^1; θ^2 que contem o parâmetro desconhecido. Intervalo de confiança para a Média Populacional • Como se sabe o estimador de µ é X . Também é conhecida a distribuição de probabilidade de X. • X = N ( µ; σ2 ) para as populações infinitas. • X = N (( µ; σ2 / n ( N – n / N – 1) ) Para populações finitas. • Assim para o caso de populações infinitas, a varias padronizadas de X. será: • • Z = X - µ / ( σ / √n ) • Fixando-se um nível de confiança : 1 - α tem-se: • Gráfico • Ou seja: P ( X - Z α /2 (σ / √n) ≤ µ ≤ Z α /2 (σ / √n) ) = 1 - α Como poderá ser verificado, a aplicação da fórmula é extremamente simples. Fixa-se o valor de 1- α, ou (1 – α) 100 = %, observa-se na tabela da Distribuição Normal Padrão o valor das abscissas que deixam α /2 em cada uma das caudas. • Com os valores de X ( média amostral) , σ = desvio – padrão da população, que neste caso é conhecido, e n ( tamanho da amostra), constrói-se o intervalo. • P ( X - Z α /2 (σ / √n) N-n / (N-1) ≤ µ ≤ Z α /2 (σ / √n) ) N-n / (N-1) ) = 1 - α Intervalo de confiança para proporção • Foi visto que f, o estimador de p, tem distribuição dada por: • F = N( p; p.q/n) para população infinita • F = N ( p; p.q/n ( N – n / N – 1)) para população finita . • Assim para o caso de população infinita, a variável padronizada de f é dada por: • Z = f-p / p – q /n • Fixando-se um nível de confiança 1 – α tem –se: • Gráfico Teste de Significância para a igualdade de duas Médias • 1º Caso : As variâncias populacionais são conhecidas, independentes e normais. • H1: µ1 ≠ µ2 ou µ1 - µ2 = d onde d > 0 é uma diferença admitida entre as médias. • H1: µ1 ≠ µ2 ou µ1 - µ2 ≠ d Os testes unicaudais são permitidos. • 2º) Fixar α. Escolhe a variável normal padrão Z. • 3º) Com auxilio da tabela da distribuição normal padrão, determinar RA e RC. • ( X1 – X2 ) - d • 4º) Cálculo do valor da variável Zcal = __________________________ • (( σ21)/ n1 ) + (( σ 22)/ n2) • 5º) Conclusões: • Se - Z α/2 ≤ Zcal ≤ Z α/2 não se pode rejeitar H0 • Se Zcal > Z α/2 ou Zcal < - Z α/2, rejeita-se H0. • Grafico: Teste de significância para a igualdade de duas proporções • 1. Ho: P1 = P2 • H1: P1 ≠ P2 • 2. Fixar α. Escolher a variável normal padrão:Z • 3. Com auxilio da tabela da distribuição normal padrão, determina-se RA e RC. • 4. Calculo do valor da variável Zcal = f1 - f2 • p^ ( 1 – p^) (1/n1 + 1/n2) • Onde f1 e f2 são frequencias relativas amostrais : P^ é o estimador comum a p1 e p2 dado por : • P^= X1- X2 / n1+n2 f1= X1/n1 e f2= x2/n2• Conclusões: • Se - Z α/2 ≤ Zcal ≤ Z α/2 não se pode rejeitar H0 • Se Zcal > Z α/2 ou Zcal < - Z α/2, rejeita-se H0. • Grafico: Faculdade Pitágoras Tema: Introdução à Estatística REFERENCIAS BIBLIOGRAFICAS FONSECA, J.S.; MARTINS, G.A. (1993). Curso de estatística. 4a ed. São Paulo: Atlas. LAPONNI, Juan Carlos (1997). Estatística usando o Excel. São Paulo: Lapponi Treinamento e Editora. Farias, A. A.; Soares, J. F. & Cesar, C.C. Introdução à Estatística. 2ª Ed., LTC - Livros Técnicos e Científicos Editora S.A., Rio de Janeiro, 2003 Montgomery, D. C. & Runger, G. C. Estatística Aplicada e Probabilidade para Engenheiros. 2a Ed., LTC - Livros Técnicos e Científicos Editora S.A., Rio de Janeiro, 2003 Bhattacharyya, G. K. & Johnson, R. A. Statistical Concepts and Methods. John Wiley & Sons,New York,1977. Werkema, M. C. C. Ferramentas Estatísticas Básicas para o Gerenciamento de Processos. Volume 2 da Série Ferramentas da Qualidade. Fundação Cristiano Ottoni, EE-UFMG, Belo Horizonte, 1995. Werkema, M. C. C. Como Estabelecer Conclusões com Confiança: Entendendo Inferência Estatística. Volume 4 da Série Ferramentas da Qualidade. Fundação Cristiano Ottoni, EE-UFMG, Belo Horizonte, 1996. .
Compartilhar