Baixe o app para aproveitar ainda mais
Prévia do material em texto
ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 1 A CIÊNCIA ESTATÍSTICA 1. Definição: Estatística é um conjunto de métodos que se destina a possibilitar tomadas de decisões acertadas, face às incertezas. (Wallis) 2. Ramos da Estatística • Estatística Descritiva: É a parte da estatística que compreende as técnicas que dizem respeito à coleta, a organização, a sumarização e à descrição interpretativa dos dados para a tomada de decisões. • Estatística Inferencial: Também chamada de amostral ou indutiva. É a parte da estatística que compreende as técnicas por meio das quais são tomadas decisões sobre uma população, decisões estas unicamente na observação de uma amostra ou na elaboração de hipóteses sobre a população de origem e formula previsões fundamentando-se na teoria das probabilidades devido ao fato de que tais decisões são tomadas em condições de incerteza. 3. Conceitos Básicos • População - O conjunto de todos os elementos que possuem pelo menos uma característica em comum, que possa ser contada, medida, pesada ou ordenada de algum modo e que sirva de base para as propriedades que se deseja investigar. • Amostra – Subconjunto de uma população em estudo. • Censo - Tipo de levantamento em que são investigados todos os elementos da população. • Amostragem - Conjunto de técnicas utilizadas para extração de amostras de uma população. • Amostra representativa - Aquela que apresenta as mesmas características gerais da população da qual foi extraída. • Amostra tendenciosa ou viciada – Aquela que não é representativa da população da qual foi extraída. • Amostra Aleatória – Aquela em que cada elemento da população tem a mesma probabilidade de ser incluído na amostra. A técnica consiste por sorteio ou utilizando uma tabela de números aleatórios. • Amostra com reposição – Cada elemento da população pode ser escolhido mais de uma vez. • Amostra sem reposição – Cada elemento da população não pode ser escolhido mais de uma vez. • Parâmetro - Uma característica numérica estabelecida para toda população. • Estatística ou um estimador - Uma característica numérica estabelecida para a amostra. ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 2 • Variáveis - São características, propriedades ou atributos que podem ser observados ou (medidos) em cada elemento de uma população ou de uma amostra e deverá produzir um e apenas um resultado. Uma variável pode ser quantitativa ou qualitativa. • Variável quantitativa – Aquela cujo resultado da observação gera uma quantidade, um número. Podem ser subdivididas em quantitativas discretas e quantitativas contínuas. Assim, uma variável discreta é aquela que apenas assume valores pertencentes a um conjunto enumerável (número inteiro). A variável contínua é aquela que assume qualquer num certo intervalo razoável de variação (nº conjunto Real). • Variável qualitativa - Aquela cujo resultado da observação gera um atributo, uma qualidade. Podem ser nominais ou ordinais. Os dados nominais surgem quando se definem categorias e se conta o número de observações pertencentes a cada categoria. Os dados ordinais consistem de valores relativos atribuídos para denotar ordem: primeiro, segundo, terceiro, etc. • Exemplos de Variáveis Quantitativas Discretas: a. População: casais residentes em uma cidade Variável: número de filhos b. População: aparelhos produzidos em uma linha de montagem Variável: número de defeitos por unidade c. População: atendimento de pacientes cardíacos Variável: número de batimentos cardíacos por minuto • Exemplos de Variáveis Quantitativas Contínuas: a. População: indústrias de uma cidade Variável: índice de liquidez b. População: Exame de pacientes com obesidades Variável: nível de colesterol c. População: pessoas residentes em uma cidade Variável: idade • Exemplos de Variáveis Qualitativas Nominais: a. População: moradores de uma cidade Variável: cor dos olhos (pretos, castanhos, azuis, etc.) b. População: peças produzidas por uma máquina Variável: qualidade (perfeita ou defeituosa) c. População: atendimento de clientes Variável: sexo (masculino ou feminino) • Exemplos de Variáveis Qualitativas Ordinais: a. População: exame em um concurso público Variável: colocação (primeiro, segundo, terceiro, etc.) b. População: grau de instrução Variável: alfabetizados (1º grau, 2º grau, 3º grau) c. População: grau de recuperação de uma doença Variável: classificação (acima da média, média, abaixo da média) • Variável Aleatória – Uma variável aleatória é aquela cujos valores são determinados por processos acidentais, ao acaso, que não estão sob o controle do observador • Distribuição de Probabilidade - Quando se atribuem valores de probabilidade a todos os possíveis valores de uma variável aleatória X, tanto por uma listagem como por uma função matemática, o resultado é uma distribuição de probabilidade. • Distribuição Amostral – É a distribuição de probabilidade de uma estatística amostral. ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 3 DISTRIBUIÇÃO DE PROBABILIDADE NORMAL É um modelo particular de Variável Aleatória Contínua (VAC) cuja função densidade de probabilidade é dada por: ∞<<∞⋅ π⋅2⋅δ 1 = 2 δ µ− ⋅ 2 1 − X- ,e)x(f X Notação: );( NX 2δµ≅ Características: a) É simétrica em relação à média, moda e mediana; b) É assintótica em relação ao eixo do “X”. c) É mesocúrtica; d) A área sob o gráfico da função densidade f(x) é o eixo do “X” é igual a 1,00; e) Possui dois pontos de inflexão: A Curva Normal Padrão – A Variável Z Para padronização de uma variável real, X, usa-se a seguinte expressão: δ µ− = X Z onde: Z = valor da variável X expresso em desvios padrões, X = valor da variável a ser padronizado µ = média da variável σ = desvio padrão da variável X A distribuição da variável “Z” é a curva normal cuja média vale zero e o desvio- padrão vale 1,00. Se usar escores Z, você pode transformar qualquer distribuição normal numa distribuição normal padrão. Determinação de áreas sob a curva normal padrão: A Tabela da Curva Normal Padrão A tabela a seguir mostra todas as áreas entre z = 0 e z = 3,99 que correspondem às probabilidades de ocorrência da variável z entre esses valores. Ponto de inflexão Ponto de inflexão ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 4 ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 5 Localização de uma área entre 0 e z, na tabela da curva normal padrão Exemplo: Suponha que se queira achar área entre z = 0 e z = 1,31 Para achar na tabela a área entre 0 e 1,31, localize 1,3 na primeira coluna da tabela abaixo onde se encontra a parte inteira e a primeira decimal do valor de z (veja seta). Em seguida localize 0,01 a segunda casa decimal do valor de z, que se encontra na primeira linha, em destaque, da tabela (veja seta). No cruzamento das duas setas encontra-se o número 0,4049 que é área entre 0 e 1,31. z0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 Observação: Apenas a área entre 0 e z está na tabela. (a área entre 0 e –z é a mesma entre 0 e z, uma vez que a curva é simétrica em relação a média). 0,4049 ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 6 Exemplo: Determine o valor de z que corresponde à seguinte área: a) A área à direita de z é 0,2090 Solução: Metade da área = 0,5000 0 z = 0,81 z Como a área dada, 0,2090, está à direita de z e é menor que 0,5000, isso significa que z é um número que está à direita de 0, isto é, z é um número positivo. Para achar o valor de z na tabela precisa-se da área entre 0 e z que é tabelada. Sendo a área tabelada = 0,2910, entra-se na tabela para achar o valor de z. z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549 0,7 0,2580 0,2611 0,2642 0,2673 0,2703 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 Como as áreas da tabela estão dispostas em ordem crescente para baixo e para a direita é fácil localizar qualquer área. Neste caso a área 0,2910 está localizada conforme a indicação das setas correspondendo ao valor de z = 0,81. Observação: Se, por acaso, a área não for encontrada exatamente, use a área que estiver mais próxima (da direita ou da esquerda). Área dada = 0,2090 Área tabelada = 0,5000 - 0,2090 = 0,2910 0,2910 ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 7 EXEMPLO: Em indivíduos sadios, o consumo renal de oxigênio tem distribuição normal de média 12 cm3 /min. e desvio-padrão 1,5 cm3 /min. Determinar a proporção de indivíduos sadios com consumo: a) superior a 13,5 cm3 /min 12 13,5 0 + z = 1,00 b) inferior a 10 cm3 /min 10 12 - z =1,33 0 c) entre 9,4 e 13,2 cm3 /min 9,4 12 13,2 - z =1,73 0 + z=0,80 d) entre 12,5 e 14,3 cm3 /min 12 12,5 14,3 0 +z1=0,33 +z2=1,53 e) Se um indivíduo apresentar um consumo renal de 18 cm3 /min., você consideraria esse indivíduo sadio? Não 0920=40820−500= 331−= 51 12−10 = ,,,P , , z 15900=34130−500= 001= 51 12−513 = ,,,P , , , z 0,3413 0,1590 0,4082 0,092 731−= 51 12−49 = , , , z 7460=28810+45820= 800= 51 12−213 = ,,,P , , , z 3080=12930−43700= 531= 51 12−314 = 330= 51 12−512 = 2 1 ,,,P , , , z , , , z 0,4582 0,2881 0,1293 0,4370 ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 8 ESTIMAÇÃO Definição: É o processo que consiste em utilizar dados amostrais para estimar os valores de parâmetros populacionais desconhecidos, ou seja, quando usamos os resultados extraídos da amostra para produzir inferências sobre a população da qual foi extraída aleatoriamente a amostra. ─ Qualquer característica de uma população pode ser estimada a partir de uma amostra aleatória. Entre as mais comuns, estão a média, a variância e o desvio-padrão. ─ As estatísticas amostrais são utilizadas como estimadores de parâmetros populacionais. Assim, a média, a variância e desvio-padrão amostral são usados como estimativas para a média, a variância e o desvio-padrão populacional. População (N) Amostra (n) Indução Tipos de Estimativa: Estimativa por ponto: quando a partir da amostra procuramos obter um único valor de certo parâmetro populacional. Estimativa por intervalo: quando a partir da amostra procuramos construir um intervalo com uma certa probabilidade de conter o verdadeiro parâmetro populacional, denominado de intervalo de confiança (I.C.). INTERVALOS DE CONFIANÇA (IC) IC PARA A ESTIMAÇÃO DA MÉDIA POPULACIONAL QUANDO A VARIÃNCIA POPULACIONAL É CONHECIDA: Utiliza-se a Distribuição Normal, quando: n ≥ 30 (amostra grande). Nível de Confiança (1 – α ) : É a probabilidade de se acertar na estimação desejada Nível de Significância ( α ) : É a probabilidade de se errar na estimação desejada. eeee = Erro absoluto máximo de estimação. Estatísticas ou Estimadores S S X 2 __ Parâmetros σσµ 2 Amostragem Aleatória ( ) ( ) 22 22 2 σ⋅+1−⋅ ⋅σ⋅ =∴ 1− − ⋅ σ ⋅=⇒ σ⋅ =∴ σ ⋅=⇒ α=+≤µ≤− 2 α 2 α 2 α 2 α 2 α Z)N( NZ n N nN n Z finita .pop Z n n Zinfinita pop. -1)XX(P ____ 2 e e e e ee Z02αZ− 2 αZ+ ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 9 IC para média pop. quando a variância pop. (é conhecida). Exemplo: Um serviço de testes psicológicos verificou o aumento da pulsação durante a execução de determinada tarefa sob condições simuladas se um administrador está emocionalmente apto para assumir a presidência de uma grande empresa. De uma população composta de 2.000 candidatos com variância 18,32 foi extraída uma amostra aleatória de 400. Sabendo que a taxa média da amostra apresentou um aumento de 27,33 batidas por minuto. Estime para um nível de confiança de95% o verdadeiro aumento médio de pulsação dos candidatos no desempenho daquela tarefa. SOLUÇÃO: INTERPRETAÇÃO: O intervalo [26,95; 27,71] contém o verdadeiro aumento médio da pulsação da população com 95% de confiança. 0,9527,71)P(26,95 0,950,38)27,330,38-P(27,33 -1)XX(P 0,38 400 4,28 1,96 N nN n Z ____ =≤µ≤ =+≤µ≤ α=+≤µ≤− = 1−2000 400−2000 ⋅⋅= 1− − ⋅ σ ⋅= 2 α ee e e e 9612 ,Z =+ α9612 ,Z =− α 0 02500 2 050 2 0509501 96147500 2 950 9501 2 , , ,, ,Z, , Área , == =−= =⇒== =− α α α α 47500, )finita.pop%(% infinita) .pop(% N n se e finita) .pop(% N n relação a Se ,, ,X grande) (amostra 30 400n N __ 5>20= 2000 400 ⇒5≤⇒5> 284=3218=σ 3327= >= 2000= 9501 ,=− α 47500,02500, 02500, 2 α 2 α ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 10 INTERVALOS DE CONFIANÇA (IC) IC PARA A ESTIMAÇÃO DA MÉDIA POPULACIONAL QUANDO A VARIÃNCIA POPULACIONAL É DESCONHECIDA: O processo para se obter o IC é semelhante aquele mostrado no item anterior. Como não se conhece a variância populacional, porém é necessário substituí-lo pela variância amostral. Utiliza-se a Distribuição “t” de Student, quando n < 30 (amostra pequena). A Distribuição “t” sempre supõe a normalidade da variável estudada. Deve-se consultar a Tabela (t) com (n-1) graus de liberdade. IC para média pop. quando a variância pop. (é desconhecida). Exemplo: Um serviço de testes psicológicos desejando conhecer o tempo médio que uma pessoa de mais de 65 anos consegue se concentrar selecionou uma amostra de 25 pessoas de uma população de 1.000 apurando a sua média amostra em 20 minutos e sua variância amostral em 3,8 minutos. Estime para um intervalo de confiança de 95% o verdadeiro tempo médio de duração de concentração desse grupo. SOLUÇÃO: INTERPRETAÇÃO: O intervalo [19,10min.; 20,90min.] contém a verdadeira duração de concentração com 95% de confiança. t 0 2 αt− 2αt+ ( ) ( ) 22 22 2 2 2 2 2 2 11 St)N( NSt n N nN n S t finita .pop St n n S tinfinita pop. -1)XX(P ____ ⋅+−⋅ ⋅⋅ =∴ − − ⋅⋅=⇒ ⋅ =∴⋅=⇒ =+≤≤− α α α α α αµ 2 e e e e ee liberdade de graus )n( 1−=ϕ )initainf.pop(%%, )initainf.pop(% N n se e finita) .pop(% N n relação a Se ,,S,S horas X pequena) (amostra 30 25n N 2 __ ⇒≤= ⇒≤⇒> ==⇒== <== 552 1000 25 55 9518383250 1000 06392 0509501 9501 2 ,t g.l. 241-251-n e 0,05 para t Tabela ,, , = ==== =−= =− α ϕα α α 9501 ,=− α02500 2 ,=α 02500 2 ,=α 063922 ,t =+ α063922 ,t =− α 0 0,950,90)P(19,10 0,950,90)min 200,90 - P(20min min. 0,90 25 1,95 2,0636 =≤≤ =+≤≤ =⋅= 2µ µ e ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 11 INTERVALOS DE CONFIANÇA (I. C.) IC PARA A ESTIMAÇÃO DA VARIÂNCIA E DESVIO-PADRÃO Determina-se o intervalo de confiança para estimação da variância populacional e do desvio-padrão populacional aplicando a Distribuição de Probabilidade Qui-Quadrado (X2). Consulta-se a Tabela do Qui-Quadrado (X2) com (n-1) graus de liberdade. Intervalo para estimar a variância populacional: Como o desvio-padrão é a raiz quadrada da variância: Intervalo para estimar o desvio-padrão populacional: IC para Variância e Desvio-padrão. Exemplo: Em um estudo elaborado para verificar a capacidade de percepção espacial dos alunos da 8ª série do ensino fundamental, um psicopedagogo constatou um desvio-padrão de 10 segundos para uma amostra de 16 alunos. Determine limite de confiança de 95% para a variância e o desvio-padrão de todos os alunos da mesma série. INTERPRETAÇÃO: O intervalo [7,4s; 15,5s] contém o verdadeiro desvio-padrão para a percepção espacial com 95% de confiança. αδ -1 X S)n( X S)n( P eriorinferiorsup = ⋅− ≤≤ ⋅− 2 2 2 2 2 11 αδ -1 X S)n( X S)n( P eriorinferiorsup = ⋅− ≤≤ ⋅− 2 2 2 2 2 11 ( ) ( ) ( ) 950=≤δ≤47 950=7240≤δ≤ 950=7240≤δ≤554 950= 236 10⋅1−16 ≤δ≤ 527 10⋅1−16 236=⇒9750=0250−1=α=ϕ 527=⇒=α15=ϕ 2 2 2 2 2 2 ,15,5ss ,P ,,54,5P :padrão-desvio o para IC ,, ,P , , )( , )( P :variância a para IC ,X,, e 15 ,X 0,025 e eriorinf eriorsup ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 12 INTERVALOS DE CONFIANÇA (IC) IC PARA A ESTIMAÇÃO DA PROPORÇÃO (p) A Distribuição de Probabilidade aplicável a proporções é a Distribuição de Probabilidades Binomial. Contudo, utiliza-se a Distribuição Normal como aproximação da Binomial para a construção de intervalos de confiança para as proporções. Tal aproximação é apropriada quando .n 30≥ A estimativa de uma proporção, percentagem ou probabilidade populacional é uma proporção amostral (f = x/n), onde x é o número de vezes que um evento correu em n provas. IC para Proporção. Exemplo Em uma amostra aleatória, 136 dentre 400 pessoas que tomaram um ansiolítico sentiram algum efeito colateral. Construa um IC de 95% de confiança para a verdadeira proporção das pessoas que experimentam efeito colateral com o referido medicamento. INTERPRETAÇÃO: O intervalo [29,4%; 38,6%] contém a verdadeira proporção com 95% de confiança. Ou seja, de 118 a 155 pessoas. 2 α+Z2α−Z 0 α−1 2 α 2 α 9612 ,Z =+ α9612 ,Z =− α 0 47500, 9501 ,=− α 47500,02500, 02500, 2 α 2 α ( ) ( ) )f(fZ)N( N)f(fZ n N nN n )f(f Z finita .pop Z )f(fn n )f(f Zinfinita pop. -1)fpf(P −1⋅⋅+1−⋅ ⋅−1⋅⋅ =∴ 1− − ⋅ −1⋅ ⋅=⇒ ⋅−1⋅=∴ −1⋅ ⋅=⇒ α=+≤≤− 2 2 2 2 α 2 α 2 α 2 α 2 α 2 e e e e ee %%),p%,(P ,),p,(P ,),,p,,(P , ),(),( ,e , n x f x n 95=638≤≤429 950=3860≤≤2940 950=0460+340≤≤0460−340 0460= 400 340−1⋅340 ⋅961= 340= 400 136 == 136= 400= ESTATÍSTICA II (Curso: Psicologia) – Prof. Afonso 13 ATIVIDADES1. A ingestão de um medicamento adormece o paciente. O tempo decorrido entre a ingestão do medicamento e o adormecimento em minutos é distribuído normalmente com σ = 10 min. Uma amostra de 25 pacientes submetidos ao tratamento com o remédio é formada. Observou-se que Σ .minx i 1375= Construir em IC para µ, com limites µ1 e µ2 (µ1 < µ2), de forma que seja observada a seguinte especificação: à desconfiança que µ seja menor que µ1, atribuiremos o nível de 5% enquanto à desconfiança que µ > µ2, atribuiremos o nível de 10%. (Observação: IC com limites assimétricos). 2. Um exame padrão de inteligência tem sido usado em uma empresa com desvio-padrão de 7 pontos numa amostra de 25 empregados. Determine o limite de confiança de 97,5% para o desvio-padrão de todos os empregados da empresa. 3. Em um estudo de liberdade condicional com trabalho para presos condenados por crimes não-violentos, constatou-se que 60 deles (presumivelmente, uma amostra aleatória) puderam manter os empregos ganhando uma média de R$ 7,22 por hora, com desvio-padrão de R$ 2,02 por hora. O que se pode afirmar, com 95% de confiança sobre o erro máximo, se tomarmos a média amostral de R$ 7,22 por hora como estimativa do verdadeiro salário-horário para essa população de detentos? 4. Um estudo feito por um psicólogo de uma companhia aérea mostrou que numa amostra de 300 pessoas, 180 têm medo de voar. Encontre os limites de confiança de 90% e 95% para a proporção da população com aerofobia. 5. Em uma grande área metropolitana em que estão localizadas 800 farmácias, para uma amostra aleatória de 30 farmácias, 20 comercializam um determinado medicamento controlado. Usando um IC de 95%, estime a proporção de todas as farmácias daquela área metropolitana que comercializam tal medicamento, bem como o número total de farmácias. 6. Suponha que a variável escolhida num estudo seja a proporção de pacientes que sofrem de bulimia nervosa e que pesquisador tenha elementos para suspeitar que essa porcentagem seja de 30%. Admita a população infinita com nível de confiança de 99% e um erro amostral de 2%. Calcule o tamanho da amostra para este estudo. 7. Admita os mesmos dados da questão anterior, mas supondo que o pesquisador não tem condições de suspeitar sobre a porcentagem de pacientes que sofrem de bulimia nervosa. De quanto seria o tamanho da amostra? 8. Admita os mesmos dados da questão anterior e determine o tamanho da amostra para uma população finita de 2000 pacientes. 9. Suponha que a variável escolhida num estudo seja mulheres que apresentam síndrome de pânico após agressão física. Admita uma população infinita e com desvio-padrão igual a 10 na escala de grau de controle emocional. Calcule o tamanho da amostra admitindo-se um nível de confiança de 95,5% e um erro amostral de 1,5. 10. Admita os mesmos dados da questão anterior e determine o tamanho da amostra para uma população finita de 600 mulheres.
Compartilhar