Baixe o app para aproveitar ainda mais
Prévia do material em texto
Top 10 Assuntos de Estatística para Concurso Anselmo Alves Conteúdo Conteúdo 2 I Estatística Descritiva 8 1 Coe�ciente de Assimetria de Pearson 9 2 Medidas de Posição e Dispersão 16 3 Boxplot 22 2 88 Anselmo Alves Estatística para Concurso II Probabilidade 26 4 Probabilidade Condicional e Indepen- dência 27 5 Função de Densidade e Função de Dis- tribuição 33 6 Distribuições Especiais 38 III Estimação 44 7 Intervalo de Con�ança 45 IV Teste de Hipóteses 50 8 Fundamentos de Teste de Hipóteses 51 3 88 Anselmo Alves Estatística para Concurso V Análise de Regressão 57 9 Correlação e Regressão 58 VI Amostragem 69 10 Técnicas de Amostragem 70 VII Dicas de Estudos 79 11 Bibliogra�a Indicada 80 12 Aulas Grátis de Estatística 84 4 88 Quem Sou Eu “Essencialy all models are wrong, but some are usefull”. (George E.P. Box) Olá tudo bem? Meu nome é Anselmo Alves1, sou servidor público e estou aqui para ajudar você a se preparar para concursos nas áreas de probabilidade e estatística. Parabéns por chegar aqui! Demonstra que você realmente está comprometido com sua aprovação. 1 Estatístico (ENCE/IBGE) 5 88 Anselmo Alves Estatística para Concurso Abaixo você verá uma coletânea das Top Ques- tões de Estatística para Concurso. Trata-se dos assuntos mais quentes em concurso público no que diz respeito a probabilidade e esta- tística. Tudo resolvido na íntegra e passo a passo pra você. Vou mostrar que com um pouquinho de técnica em provas de probabilidade e estatística você já pode ir bem longe. E poque vou fazer isso? Porque eu relamente quero que você perceba que sua aprovação não de- pende de sorte. Estou aqui para pegar na sua mão e lhe conduzir à aprovação. Eu con�o em você! Se você con�a em si pode me convidar para trilhar juntos esse caminho. Bons estudos! 6 88 Anselmo Alves Estatística para Concurso estatisticaparaconcurso.com 7 88 https://estatisticaparaconcurso.com estatisticaparaconcurso.com Parte I Estatística Descritiva 8 88 Capítulo 1 Coe�ciente de Assimetria de Pearson Esse conhecimento aparece dentro de estatística descritiva. Envolve reconhecer e avaliar a simetria de distribuições de frequência ou formato das curvas de modelos de distribuição de probabilidade. O referencial é a distribuição normal de probabi- lidade que é simétrica em torno da média, moda e 9 88 Anselmo Alves Estatística para Concurso mediana. Normalmente o concurseiro costuma decorar o formato das curvas: simétrica, assimétrica à direita ou assimétrica à esquerda. Veja uma questão envol- vendo esses conhecimentos. UFG/CS TAE-UFG/2018 Técnico em Estatística 1. Considere X uma variável aleatória contínua e assimétrica à esquerda (também conhecida como assimétrica negativa). Da relação entre os parâmetros Média (Me), Mediana (Md) e Moda (Mo) encontra-se: (A) Me = Md = Mo (B) Me > Md > Mo (C) Me < Md < Mo (D) Me = Md > Mo 10 88 Anselmo Alves Estatística para Concurso Sejam σ o desvio padrão, Me, Md e Mo: média, mediana e moda. AP1 = Me−Mo σ AP2 = 3(Me−Md) σ Assimetria é negativa: AP1 < 0 ⇒ Me−Mo σ < 0 Como σ > 0 devemos ter Me−Mo < 0 ⇒ Me < Mo Segundo Coe�ciente, 3/σ > 0: AP2 < 0 ⇒ 3(Me−Md) σ < 0 Me−Md < 0 ⇒ Md > Me 11 88 Anselmo Alves Estatística para Concurso Agora podemos considerar Me < Mo Me < Md Somando-se as desigualdades podemos escrever 2Me < Mo + Md⇒ Mo > 2Me︸︷︷︸ <2Md −Md ︸ ︷︷ ︸ <Md Mo > Md Resumo: Assimetria Negativa: Me < Md < Mo. A resolução acima, embora bem detalhada não leva mais que um minuto e meio. Basta saber as fórmulas dos coe�cientes de assimetria de Pearson. 12 88 Anselmo Alves Estatística para Concurso Você pode dizer que terá de decorar a fórmula, mas aí não tem jeito. Terá mesmo que decorar, mas de tanto usar isso se torna natural. Assim como a fórmula de Bhaskara. Lembra dela? Pelo mesmo raciocínio, podemos resumir: i) Simetria: Me = Mo = Md. ii) Assimetria negativa: Me < Md < Mo. iii) Assimetria positiva: Mo < Md < Me. O gabarito da questão 1 é C. Veja abaixo duas variações da mesma questão: 13 88 Anselmo Alves Estatística para Concurso Analista Legislativo do Senado (FGV/2008) 2. A �gura a seguir ilustra o histograma de uma distribuição de freqüências. Entre os ternos de valores a seguir, o único que representa uma con�guração plausível para os valores da média, moda e mediana dessa distribuição, respectivamente, é: (A) 20, 16 e 17. (B) 16, 16 e 16. (C) 20, 17 e 16. (D) 17, 20 e 16. (E) 17, 17 e 20. 14 88 Anselmo Alves Estatística para Concurso TJPA - Analista Judiciário (Vunesp/2015) 3. A �gura abaixo representa o grá�co relativo a uma distribuição de frequência F para uma amostra de dados. Seja Me o valor da mé- dia, Md o valor da mediana e Mo o valor da moda, então: (A) Me < Md < Mo (B) Md < Mo < Me (C) Mo < Md < Me (D) Me < Mo < Md (E) Md < Me < Mo Gabaritos: 2. A, 3. C 15 88 Capítulo 2 Medidas de Posição e Dispersão Esse tipo de questão aparece frequentemente no contexto da estatística descritiva. Muito embora exista uma forma elegante e pro- �ssional de mostrar as propriedades da média e da variância manipulando somatórios, a maneira mais rápida de se resolver essas questões é por meio das 16 88 Anselmo Alves Estatística para Concurso propriedades de valor esperado e de variância no contexto de probabilidade. Seja X uma variável aleatória constante e k uma constante i. E(X + k) = E(X) + k; ii. E(kX) = k · E(X); iii. Var(X + k) = Var(X); iv. Var(kX) = k2 · Var(X); v. Dp(kX) = k ·Dp(X); vi. Cv(kX) = kDp(X) kE(X) = Cv(X); vii. VarRel.(k ·X) = k 2·Var(X) k2·E(X)2 = VarRel.(X) 17 88 Anselmo Alves Estatística para Concurso TRT 12ª Região - Analista Judiciário (FCC/2013) 4. Uma população é formada por n números estritamente positivos X1, X2, X3, . . . , Xn. Com relação à atipicidade e assimetria em um conjunto de dados e às de�nições e proprie- dades das medidas de posição e de dispersão, (A) somando ou subtraindo uma constante k (k > 0) de todos os elementos da po- pulação, a nova média aritmética e o novo desvio padrão não se alteram. (B) multiplicando por k (k > 0) todos os elementos da população, a nova média aritmética �ca multiplicada por k e o novo desvio padrão também �ca multi- plicado por k. (C) multiplicando todos os elementos da po- pulação por uma mesma constante k (k > 0), o novo coe�ciente de variação �ca multiplicado por k. 18 88 Anselmo Alves Estatística para Concurso (D) somando ou subtraindo uma constante k (k > 0) de todos os elementos da po- pulação, tem-se que a nova variância �ca somada ou subtraída de k2. (E) considerando que a população é unimo- dal e veri�cando que o valor da moda é inferior ao valor da mediana e ainda que o valor da média aritmética é supe- rior ao valor da mediana, então a dis- tribuição da população é assimétrica à esquerda. 19 88 Anselmo Alves Estatística para Concurso Resolução – Comentários. (A) E – Embora o desvio padrão não se altere a média �ca somada da constante k. (B) C – Veja o item i). Para o desvio padrão observa-se a variância. Var(kX) = k2 · Var(X) Dp(kX) = √ k2 · Var(X) Dp(kX) = k · √ Var(X) = k · Dp(X) (C) E – Não se altera: Cv(kX) = Dp(kX)E(Xk) = k · Dp(X) k · E(X) = Cv(X) (D) E – A variância não se altera. (E) E – Temos assimetria à direita ou assimetria positiva. 20 88 Anselmo Alves Estatística para Concurso lp.estatisticaparaconcurso/probabilidade Curso: Probabilidade para Concurso O conteúdo mais completo para a sua base em probabilidade e estatística. Acesse Agora! 21 88 http://lp.estatisticaparaconcurso.com lp.estatisticaparaconcurso/probabilidade Capítulo 3 Boxplot O boxplot traz informações contidas no resumo de cinco números: mínimo, 1º,2º e 3º quartis e máximo. xmin, Q1, Q2, Q3, xmax. Também é chamado de “caixa de bigodes”. De�ne-se dois limites para concentração dos dados: LI = Q1 − 1, 5∆Q e LS = Q3 + 1, 5∆Q, onde ∆Q = Q3 −Q1, a amplitude interquartílica. 22 88 Anselmo Alves Estatística para Concurso Valores compreendidos entre esseslimites são conhecidos como valores adjacentes. Valores supe- riores aos limites são os pontos exteriores. Neste caso indicados por um asterisco (*). Os pontos exteriores são associados ao que se convencionou chamar de valores atípcos ou outliers. São valores extremos no conjunto de dados. O boxplot nos dá uma ideia da posição, dispersão, assimetria, caudas e valores discrepantes. A linha central representa o segundo quartil (ou mediana). • Distância ou amplitude interquartílica ∆Q = Q3 −Q1 • LI = Q1 − 1, 5∆Q e LS = Q1 + 1, 5∆Q 23 88 Anselmo Alves Estatística para Concurso TJPA - Analista Judiciário (Cebraspe/2019) 5. Considerando que o desenho esquemático (boxplot) antecedente se refere a uma variável quantitativa X , assinale a opção correta. A) Metade da distribuição da variável X se encontra entre os valores 20 e 40. B) Os valores da variável X que se encon- tram no intervalo [5; 10] representam 5% da distribuição de X . C) A mediana de X é igual a 25. D) O primeiro quartil da distribuição de X é igual a 10. E) O intervalo interquartil é igual a 65. 24 88 Anselmo Alves Estatística para Concurso 5. D – Pelo box-plot temos (A) E – 1/4 dos dados estão entre 20 e 40 que são a mediana e terceiro quartil, res- pectivamente. (B) E – 25% dos dados estão entre 5 e 10 que são o mínimo e primeiro quartil, res- pectivamente. (C) E – A mediama de X é 20. (D) C – Q1 = 10 é oprimeiro quartil. (E) E – O intervalo ou amplitude interquar- tílica é ∆Q = Q3−Q1 = 40−10 = 30. 25 88 Parte II Probabilidade 26 88 Capítulo 4 Probabilidade Condicional e Independência A teoria das probabilidades é a base matemática para as aplicações estatísticas. Com um papel central dentro do pensamento e da prática estatística, durante muito tempo a inde- 27 88 Anselmo Alves Estatística para Concurso pendência foi o princípio dominante e, até hoje, tem papel relevante nas principais aplicações estatísti- cas. Os principais concurso exploram frequentemente o conceito de independência. Nesse sentido é impor- tante conhecer o espaço de probabilidades, formado pelo espaço amostral, uma coleção de eventos e uma medida de probabilidade associada. Importante também conhecer operações entre eventos: i. A é o complementar de A e indica que o evento A não ocorre; ii. (A∩B) indica que os eventosA eB ocorrem simultaneamente; iii. (A ∪B) indica que ocorre A ou ocorre B ou ocorre A ∩B. 28 88 Anselmo Alves Estatística para Concurso TJAM – Analista Judiciário (Cebraspe/2019) Em um espaço de probabilidades, as probabilida- des de ocorrerem os eventos independentes A e B são, respectivamente, P (A) = 0, 3 e P (B) = 0, 5. Nesse caso, 6. P (A ∩B) = 0, 15. 7. P (A ∪B) é superior a 0, 7. 8. P (B|A) = 0, 2. 29 88 Anselmo Alves Estatística para Concurso Resolução 6. E – Pela independência temos o resultado: P (A∩B) = P (A)P (B) = 0, 3·0, 5 = 0, 15. 7. E – Para a reunião de eventos temos: P (A ∪B) = P (A) + P (B)− P (A ∩B) = 0, 30 + 0, 50− 0, 15 = 0, 65 8. E – Probabilidade condicionada P (B|A) = P (B ∩A) P (A) = 0, 15 0, 30 = 0, 50 30 88 Anselmo Alves Estatística para Concurso MJ–DEPEN – Ag. Penitenciário (Cebraspe/2015) Considerando que, entre a população carcerária de um presídio, a probabilidade de um detento con- trair tuberculose seja igual a 0, 01; que dois detentos sejam selecionados aleatoriamente dessa população carcerária; e que as ocorrências de tuberculose entre esses detentos sejam eventos independentes, julgue os próximos itens. 9. A probabilidade de pelo menos um detento na amostra contrair tuberculose será superior a 0, 01 e inferior a 0, 03. 10. A probabilidade de os dois detentos na amos- tra contraírem tuberculose será igual a 0, 02. 31 88 Anselmo Alves Estatística para Concurso 9. C – Seja Ai = preso i tem tuberculose. Ai in- dica o preso sadio. Temos o espaço amostral: Ω = {(A1, A2), (A1, A2), (A1, A2), (A1, A2)} Temos três pontos smostrais de interesse: (A1, A2), (A1, A2), (A1, A2). Estamos inte- ressados no evento: – (A1 ∩A2) = pelo menos um doente. – P ( A1 ∩A2 ) = 1 − P (A1 ∩ A2) = 1 − 0, 99× 0, 99 = 0, 0199 10. E – Pelo teorema da multiplicação: P (A1 ∩A2) = P (A1) · P (A2|A1) = P (A1)P (A2) (indep.) = 0, 01 · 0, 01 = 0, 0001 32 88 Capítulo 5 Função de Densidade e Função de Distribuição O conceito fundamental no estudo dos modelos de probabilidade é o de função de distribuição. A partir dessa função obtemos as funções de den- sidade e também as de probabilidade. 33 88 Anselmo Alves Estatística para Concurso A função de densidade é relacionada às variáveis contínuas, enquanto às variáveis discretas estão as- sociadas as funções de probabilidade. A função de distribuição é a identidade, o RG mesmo, de cada modelo de probabilidade Vejamos exemplos de questões de concursos. 34 88 Anselmo Alves Estatística para Concurso TJAM– Analista Judiciário (Cebraspe/2019) Em determinado tribunal, a data em que cada processo é protocolado marca a data inicial deste, a partir da qual é contada a quantidade de meses que se passam até que o juiz apresente a decisão �nal sobre ele. Essa quantidade de meses é uma variável aleatória X cuja função densidade de probabilidade é dada por f(x) = x2108 , para 0 < x ≤ 6, e f(x) = 1 3e −(x−6), para x > 6, em que e é o número de Euler, base dos logaritmos neperianos. A partir dessas informações, julgue os itens a seguir. 11. Na situação apresentada, a área da região en- tre o grá�co da função f(x) e o eixo das abs- cissas, para x > 0, é igual a 1. 12. A probabilidade de que o juiz leve três meses para apresentar sua decisão �nal a respeito de determinado processo é inferior a 10%. 35 88 Anselmo Alves Estatística para Concurso 13. Conforme a situação apresentada, P (X = 6) > P (X = 5). 14. A probabilidade de que o juiz responsável por certo processo leve mais de seis meses para apresentar sua decisão �nal é inferior a 30%. Resolução 11. C–A área sob a curva da função de densidade é a probabilidade de uma variável aleatória X se menor ou igual a x. Conceito de função de distribição: FX(x) = P (X ≤ x). Toda a área sob a curva abrange toda reta real. Representa a probabilidade do evento certo que é 1. 36 88 Anselmo Alves Estatística para Concurso 12. C – A probabilidade de um variável aleatória contínua assumir um valor particular é nula, P (X = 3) = 0 < 0, 10. 13. E – Pegadinha. A probabilidade de um va- riável aleatória contínua assumir um valor particular é nula. 14. E – Veja que P (X ≤ 6) é dada por F (X) = ∫ x 0 t2 108 dt = t3 3 · 108 ∣∣∣∣∣ x 0 , 0 ≤ x ≤ 6 Portanto FX(6) = P (X ≤ 6) = 63 3 · 108 P (X ≤ 6) = 2 3 = 66, 67% P (X > 6) = 33, 33% 37 88 Capítulo 6 Distribuições Especiais São importantes modelos de distribuição de proba- bilidade. Destaco a binomial dentre as variáveis discretas. Nas contínuas a normal é a mais importante. Existe ainda uma relação entre probabilidades bino- miais que podem ser aproximadas pela normal. 38 88 Anselmo Alves Estatística para Concurso MDA – Estatístico (COSEA – UFF/2009) 15. Um candidato a um concurso público sabe que o tempo necessário para que ele viaje de sua residência para o local de prova é distribuído de forma aproximadamente normal, com mé- dia de 1 hora e 15 minutos e desvio-padrão de 5 min. Ele deve sair de casa, na parte da manhã, de maneira que ele esteja 95% seguro de chegar ao local de prova às 8 horas da ma- nhã às: (considere Z = 1, 96). A) 6 h B) 6 h 35 min C) 6 h 45 min D) 6 h 55 min E) 7 h 39 88 Anselmo Alves Estatística para Concurso 15. B – O candidato precisa fazer um tempo X tal que a distância entre X e a média µ = 75 min garanta com uma probabilidade de 95% que chegará as 8h. O tempo gasto é tal que: P (|X − µ| < q) = 0, 95 Consequentemente: P (−q < X − µ < q) = P (− q5 < X−µ 5 < q 5) = 0, 95 Onde Z = X−µ5 ∼ N(0, 1). Logo q 5 = 1, 96 ⇒ q = 9, 8 min. Concluímos que o candidato deve sair com 85 minutos de ante- cedência. Isso corresponde a 6h e 35 min. 40 88 Anselmo Alves Estatísticapara Concurso EsFCEx – Exército – Estatístico (IDIB/2018) 16. Suponha que a v.a. Y tenha distribuição bi- nomial com parâmetros n = 10 e p = 0, 5. A probabilidade de P (Y ≤ 5) é de: (A) 0, 500 (B) 0, 250 (C) 0, 321 (D) 0, 623 (E) 0, 125 41 88 Anselmo Alves Estatística para Concurso Resolução 16. D – Seja Y ∼ B(10, 1/2). Aproximação da binomial pela distribuição normal: E(X) = np = 10 · 1/2 = 5 Var(X) = np(1−p) = 10 ·1/2 ·1/2 = 10/4 Sn − np√ np(1− p) ∼ N(0, 1) Queremos calcular P (Y ≤ 5) = P ( Sn − np√ np(1− p) ≤ 5 + 0, 5− 5√ 10/4 ) = P ( Z ≤ 0, 5 0, 5 √ 10 ) = P ( Z ≤ √ 10 10 ) Note que a probabilidade é maior que 0, 50, já que √ 10/10 > 0, portanto apenas D pode ser correta. 42 88 Anselmo Alves Estatística para Concurso Veja que estamos aproximando probabilida- des binomiais (discretas) pela distribuição normal (contínua). Nesse procedimento deve- mos somar 0, 5 a �m de compensar a área da barra central veri�cada no histograma anaixo: Segundo a literatura essa aproximação é vá- lida quando temos np ≥ 5 e npq ≥ 5. Na prática comete-se um pequeno erro quando np = 5. 43 88 Parte III Estimação 44 88 Capítulo 7 Intervalo de Con�ança Um dos procedimentos mais usados em estatística é a estimação de parâmetros. Na estimação começa-se a usar probabilidade, amostragem e a teoria estatística em conjunto. A base para aplicação dos intervalos de con�- 45 88 Anselmo Alves Estatística para Concurso anças que mais aparecem em prova é a estatística frequentista. A estimação intervalar comumente usa o que se conhece por método pivotal para a obtenção do intervalo de con�ança associado à estimação de um parêmetro populacional. Tecnicamente um pivô é uma estatística cuja dis- tribuição não depende do parâmetro que se quer estimar. Por exemplo: se X é uma população com distribuição normal com média µ e desvio padrão σ, dada uma amostra X1, X2, . . . , Xn, isto é, uma amostra aleatória de tamanho n, a variável aleatória média amostral é tal que X ∼ N ( µ; σ√ n ) de sorte que X−µ σ/ √ n ∼ N(0, 1) é um pivô para esti- mar a média populacional µ. 46 88 Anselmo Alves Estatística para Concurso MJ/Polícia Federal – Agente da PF (Cebraspe/2018) O tempo gasto (em dias) na preparação para de- terminada operação policial é uma variável alea- tória X que segue distribuição normal com média M, desconhecida, e desvio padrão igual a 3 dias. A observação de uma amostra aleatória de 100 ou- tras operações policiais semelhantes a essa produziu uma média amostral igual a 10 dias. Com referência a essas informações, julgue os itens que se seguem, sabendo que P (Z > 2) = 0, 025, em que Z denota uma variável aleatória nor- mal padrão. 17. A expressão 10 dias ±6 dias corresponde a um intervalo de 95% de con�ança para a mé- dia populacional M . 18. O erro padrão da média amostral foi inferior a 0, 5 dias. 47 88 Anselmo Alves Estatística para Concurso 17. E –A estatística X−M 3/ √ n é um pivô para a média M . Pela simetria: Para obter o intervalo de con�ança (1− γ)× 100% para M escrevemos: Pr ( zγ/2 < X −M 3/ √ n < zγ/2 ) = 1− γ Com isso podemos isolar M na desigualdade: IC(M)(1− γ)× 100% = X ± zγ/2 × 3√n . Para um coe�ciente de con�ança de 95%, te- mos z2,5% = 2. IC(M)(1−γ)×100% = 10±2× 3 10 ≡ 10±0, 6 48 88 Anselmo Alves Estatística para Concurso 18. C – O erro padrão é a estimativa da vari- ância para a média amostral. Temos que X ∼ N(M ; 2/ √ n). Portanto ÊP(X) = 3/ √ 100 = 0, 3. 49 88 Parte IV Teste de Hipóteses 50 88 Capítulo 8 Fundamentos de Teste de Hipóteses Teste de hipóteses é a principal ferramenta da esta- tística inferencial e nos ajuda na tomada de decisão. Ao realizar um teste de hipóteses estamos sujeitos a cometer erros. Esses erros abaixo e associamos algumas probabilidades a certos eventos: 51 88 Anselmo Alves Estatística para Concurso Teste de Hipóteses: regra estatística. H0 : θ ∈ Θ0 versus H1 : θ ∈ Θ1 Decisão Realidade H0 Verdadeira H0 Falsa Não Rejeitar H0 Sem erro Erro Tipo II Rejeitar H0 Erro Tipo I Sem erro Aos erros associamos algumas probabildiades. i. Erro do Tipo I: α = Pr (Rejeitar H0|H0 Verdadeira) ii. Erro do Tipo II: β = Pr (Não Rejeitar H0|H0 Falsa) iii. Note queα e β não são erros complementares. À probabilidade complementar ao erro do tipo II chamamos poder do teste: 1− β = Pr (Rejeitar H0|H0 Falsa) 52 88 Anselmo Alves Estatística para Concurso Note que a situação ideal é construir um teste com α pequeno e alto poder, ou seja, proba- bailidade pequena de cometer o erro do tipo I e alta probabilidade de rejeitar uma hipótese nula falsa. Importante dizer que sempre ocorrerá o risco de se incorrer nesses tipos de erros. Normalmente α é arbitrado num valor pequeno pelo estatístico: 0, 1%,1%, 2% e 5%. Pela sua importancia α é cha- mado de nível de signi�cância do teste. A construção de testes de hipóteses é tarefa do estatístico e envolve outras facetas. Aqueles testes mais comuns em provas de concurso são as aplica- ções mais simples dessa importante teoria estatís- tica. Vejamos exemplos. Abaixo temos um teste que apareceu em conjunto com as questões 17 e 18. 53 88 Anselmo Alves Estatística para Concurso MJ/Polícia Federal – Agente da PF (Cebraspe/2018) 18. Considerando-se o teste da hipótese nula H0 : M ≤ 9, 5 dias contra a hipótese al- ternativa H1 : M > 9, 5 dias, adotando-se o nível de signi�cância igual a 1%, não haveria evidências estatísticas contra a hipótese H0. Resolução i. H0 : M ≤ 9, 5 contra H1 : M > 9, 5. ii. Estatística de teste: X−M 3/ √ n ∼ N(0, 1). Onde X é a média amostral. iii. Regra de decisão: rejeito H0 se, e somente se, X−M 3/ √ n > z99%, ao nível de 1% de signi�cân- cia. 54 88 Anselmo Alves Estatística para Concurso Veja que X −M 3/ √ n = 10− 9, 5 3/10 = 1, 667 Note que P (Z < −z1%) = P (Z > z99%) P (Z > z99%) < P (Z > 2) = 2, 5% Agora podemos a�rmar ser z99% > 2, por- tanto a estatística de teste é menor que z99%. Conclusão: não rejeitamos H0, a�rmamos não haver evidências contra H0 ao nível de signi�cãncia de 1%. – O item está correto. 55 88 Anselmo Alves Estatística para Concurso Manaus–AM – Fiscal de Tributos (FCC/2019) 19. De um estudo, obtiveram-se informações de uma amostra aleatória extraída de uma po- pulação. Em um teste de hipóteses, foram formuladas as hipóteses H0 (hipótese nula) e H1 (hipótese alternativa) para analisar um pa- râmetro da população com base nos dados da amostra. O nível de signi�cância deste teste corresponde à probabilidade de (A) não rejeitar H0, dado que H0 é falsa. (B) rejeitar H0, dado que H0 é falsa. (C) rejeitar H0, dado que H0 é verdadeira. (D) não rejeitar H0, independente de H0 ser falsa ou verdadeira. (E) rejeitar H0, independente de H0 ser falsa ou verdadeira. Item C: Ao nível de signi�cância corresponde a probabilidade do erro do tipo I. 56 88 Parte V Análise de Regressão 57 88 Capítulo 9 Correlação e Regressão Correlação e regressão são assuntos presentes em praticamente a totalidade de concursos que cobram probabilidade e estatística. Essa disciplina é um primeiro passo dentro da modelagem estatística. 58 88 Anselmo Alves Estatística para Concurso A ideia principal é tomar uma variável aleatória e tentar explicar a variabilidade (aleatória!) por meio de uma ou mais variáveis explicativas. Normalmente o estatístico consegue explicar a variabilidade em média. Portanto em vez de se ter Y ∼ N(µ, σ2) teremos Y |X = x ∼ N(µ′, σ2′). Agora temos a distribuição do valor médio de Y condicionado à variável X = x, que em princípio é considerada não aleatória. A principal abordagem será obter uma amostra de pares (x1, y1), . . . , (xn, yn), isto é, uma amostra de pares (x, y) para estimar os parêmetros do modelo de regressão linear. O modelo mais simples supões y explicado por uma variável explicativa x. y = β0 + β1xi + εi 59 88 Anselmo Alves Estatística para Concurso A estimação desse modelo parte de alguns pres- supostos matemáticos ou estatísticos para a otimi- zaçãode uma função de perda. O método mais conhecido é aquele que minimiza a função do erro que se comete ao estimar os pa- râmetros β0 e β1 pela combinação linear dos valo- res amostrais. É o método dos mínimos quadrados. Podemos ainda usar método da máxima verossimi- lhança e o método dos momentos. Vamos trazer algumas questões de concursos. Pri- meiro vamos aprender sobre correlação. 60 88 Anselmo Alves Estatística para Concurso TJPA– Analista Judiciário (Cebraspe/2019) 20. Em um grá�co de dispersão, por meio de transformações convenientes, a origem foi colocada no centro da nuvem de dispersão e as variáveis foram reduzidas a uma mesma escala. Se, nesse grá�co, for observado que a grande maioria dos pontos está situada no se- gundo e no quarto quadrantes, e que aqueles que não estão nessa posição situam-se pró- ximos da origem, então a correlação linear entre as variáveis (A) será necessariamente nula. (B) poderá ser fracamente negativa. (C) será necessariamente fortemente nega- tiva. (D) será necessariamente fortemente posi- tiva. (E) poderá ser fracamente positiva. 61 88 Anselmo Alves Estatística para Concurso Resolução 20. B – Trata-se de fraca correlação negativa en- tre os dados. Em estatística uma associação ou correlação entre variáveis indica simples- mente que essas variáveis variam juntos. A medida de correlação indica a força e a dire- ção dessa associação; Nesse caso a medida que osdados aumentam no eixo x a variável y diminui no eixo dos y. 62 88 Anselmo Alves Estatística para Concurso Marinha do Brasil –Estatístico (CP-T/2019) 21. Considerando os modelos de regressão linear, coloque F (falso) ou V (verdadeiro) nas a�r- mativas abaixo e assinale a opção correta. ( ) Se duas variáveis são correlacionadas, pode-se concluir que há uma relação de causalidade entre elas. ( ) Ao veri�car que uma variável depen- dente e uma independente estão estri- tamente relacionadas, pode- se concluir que o ajuste do modelo de regressão é bom. ( ) Os valores de y são preditos com base em valores dados ou conhecidos de x. A variável y é chamada variável inde- pendente, e a variável x variável depen- dente. 63 88 Anselmo Alves Estatística para Concurso (A) (V) (V) (F) (B) (V) (F) (V) (C) (F) (F) (F) (D) (F) (V) (F) (E) (V) (V) (V) 21. C – Veja que: (F) Correlação não implica em causalidade. Em estatística uma associação ou correlação entre variáveis indica simplesmente que essas va- riáveis variam juntos. A medida de correlação indica a força e a direção dessa associação; (F) Não necessariamente. Pode-se tratar de re- gressão não linear ou ainda pode ser um mo- delo determinístico; (F) A variável y é a variável resposta ou variável dependente enquanto a variável x é explica- tiva ou independente. 64 88 Anselmo Alves Estatística para Concurso http://bit.ly/regressao2020 Análise de Regresão Linear O curso para a sua aprovação em estatística. Acesse Agora! 65 88 http://bit.ly/regressao2020 http://bit.ly/regressao2020 Anselmo Alves Estatística para Concurso ABIN – O�cial de Inteligência (Cebraspe/2018) Ao avaliar o efeito das variações de uma gran- deza X sobre outra grandeza Y por meio de uma regressão linear da forma Ŷ = α̂+β̂X , um analista, usando o método dos mínimos quadrados, encon- trou, a partir de 20 amostras, os seguintes soma- tórios (calculados sobre os vinte valores de cada variável):∑ X = 300, ∑ Y = 400; ∑ X2 = 6.000,∑ Y 2 = 12.800 e ∑ (XY ) = 8.400 A partir desses resultados julgue os itens a seguir. 22. Se, nesse modelo,a soma dos quadrados dos resíduos for SQR = 960, então o coe�ciente de determinação será R2 = 0, 8. 23. β̂ < 0. 24. Para X = 10, a estimativa de Y é Ŷ = 12. 66 88 Anselmo Alves Estatística para Concurso Resolução 22. E – Temos SQT = ∑ Y 2 − nY 2 = 12.800− 20 · 202 = 12.800− 8.000 = 4.800 Temos SQT = SQReg + SQRes Logo SQReg = SQT − SQRes = 4.800− 960 SQReg = 3.840, logo R2 = SQReg SQT = 80% 67 88 Anselmo Alves Estatística para Concurso 23. E – Temos β̂ = ∑ (XY )− nX · Y∑ X2 − nX2 β̂ = 8.400− 20 · 30 · 20 6.000− 20 · 302 β̂ = 8.400− 12.000 6.000− 18.000 = −3.600 −12.000 = 0, 3 Portando β̂ > 0. 24. E – Temos para α̂ = Y − β̂X : α̂ = 20− 0, 3 · 30 = 11 O modelo é dado por Ŷ = 11+0, 3 ·X . Logo para X = 10 Ŷ = 11− 0, 3 · 10 = 11 68 88 Parte VI Amostragem 69 88 Capítulo 10 Técnicas de Amostragem A amostragem é uma das mais úteis aplicações em estatística. Temos dois tipos básicos de técnicas de amostragem: i. Amostragem probabilística; ii. Amostragem não-probabilística. 70 88 Anselmo Alves Estatística para Concurso No primeiro tipo temos um controle da precisão estatística das estimativas, o que traz certa con�abi- lidade à metodologia, sendo passível de validação por outros pesquisadores e seguindo um protocolo rígido de execução dos trabalhos de pesquisa. Destacmos os principais métodos: • Amostragem Aleatória Simples; • Amostragem Aleatória Estrati�cada; • Amostragem Aleatória Sistemática; • Amostragem Aleatória por Conglomerados Outros métodos procuram melhorar as estimati- vas: estimadores tipo razão, regressão e amostras com probabilidades desiguais. 71 88 Anselmo Alves Estatística para Concurso Tipos de procedimentos cientí�cos e suas carac- terísticas: 1. Levantamentos Amostrais (População bem De�nida) • Probabilísticos: Controle de precisão; Seleção aleatóra, P (s) probabilidade de inclusão conhecida a priori; • Não Probabilísticos; 2. Planejamento de Experimentos (Variável Resposta) • Interferência Pesquisador; • Controle fatores externos; • Causa e efeito. 72 88 Anselmo Alves Estatística para Concurso STM – Analista Judiciário (Cebraspe/2018) Um estudo acerca do tempo (x, em anos) de guarda de autos �ndos em determinada seção judiciária con- siderou uma amostragem aleatória estrati�cada. A população consiste de uma listagem de autos �ndos, que foi segmentada em quatro estratos, segundo a classe de cada processo (as classes foram estabe- lecidas por resolução de autoridade judiciária). A tabela a seguir mostra os tamanhos populacionais (N ) e amostrais (n), a média amostral e a variância amostral dos tempos (s2) correspondentes a cada estrato. Considerando que o objetivo do estudo seja estimar o tempo médio populacional (em anos) de guarda dos autos �ndos, julgue os itens a seguir. 73 88 Anselmo Alves Estatística para Concurso 25. No estudo em questão foi aplicada uma amos- tragem aleatória estrati�cada com alocação proporcional ao tamanho dos estratos. 26. A fração amostral utilizada no estudo em tela foi igual ou superior a 10%. 27. A estimativa do tempo médio populacional da guarda dos autos �ndos é maior ou igual a 12 anos. 28. O erro padrão referente à estimação do tempo médio x no estrato D foi menor ou igual a 0, 1. 29. No desenho amostral em tela há duas unida- des amostrais: a primeira (unidade primária) corresponde à classe de cada processo, e a se- gunda (unidade secundária) refere-se a auto �ndo presente na listagem. 30. Combinando-se todos os estratos envolvidos, a estimativa da variância do tempo médio 74 88 Anselmo Alves Estatística para Concurso amostral da guarda dos autos �ndos é inferior a 0, 005 ano2. Resolução 25. C – Seja n o tamanho da amostra. Note que os pesos amostrais são - WA = NAN = 30.000 200.000 = 3 20 - WB = NBN = 40.000 200.000 = 4 20 - WC = NCN = 50.000 200.000 = 5 20 - WD = NDN = 80.000 200.000 = 8 20 - Para uma amostra de tamanho n = 2.000 nA = WA × 2.000 = 300. nB = WB × 2.000 = 400. nC = WC × 2.000 = 500. nD = WA × 2.000 = 800. 75 88 Anselmo Alves Estatística para Concurso 26. E – A fração amostral é dada por f = n N = 2.000 200.000 = 1 100 = 1% 117. E – Seja h = {A,B,C,D}, temos que x̂es = ∑ h Whxh = 3 20 · 20 + 4 20 · 15 + 5 20 · 10 + 8 20 · 5 = 3 + 3 + 2, 5 + 2 = 10, 5 118. C – Vamos calcular o erro padrão para xD: v̂ar (xD) = v̂ar (WDxD) = W 2Dv̂ar(xD) = W 2D × s2D nD = 4 25 · 8 800 76 88 Anselmo Alves Estatística para Concurso ŝd (xD) = √ 425 · 1 100 = 2 4 · 1 10 = 0, 05 119. E – A estrati�cacão procura explorar a ideia de que quanto mais homogênea for a popula- çao, mais preciso sao os resultados amostrais. Não se trata de uma amostrafem múltiplos es- tágios, portanto a unidade primária de amos- tragem corresponde au auto presente na lista- gem. A estrati�cação garante que subpopula- ções mais homogêneas estejam representadas na amostra, uma vez que de cada estrato será retirada uma AAS. 120. C – Abaixo calculamos a variância: v̂ar (xes) = v̂ar (∑ h Whxh ) 77 88 Anselmo Alves Estatística para Concurso = H∑ h v̂ar (Whxh) = ∑ h W 2h v̂ar(x) = ∑ h W 2h σ2h nh v̂ar (xes) = 9 400 · 3 300 + 16 400 · 16 400 + + 25 400 · 5 500 + 64 400 · 8 800 v̂ar (xes) = 9 40.000 + 64 40.000 + 25 40.000 + + 64 40.000 = 162 40.000 = 0, 00405 78 88 Parte VII Dicas de Estudos 79 88 Capítulo 11 Bibliogra�a Indicada Abaixo indico alguns livros que me ajudaram na trajetória de estudar estatística para concurso. Sempre reforço a necessidade de se começar es- tudando probabilidade num nível elevado. A�nla probabilidade é a base matemática para as aplica- ções de estatística para concurso. Abaixo apresento um dos livros mais completos em estatística e que atende bem na área de probabilidade. 80 88 Anselmo Alves Estatística para Concurso 1. Estatística Básica dos professores Wilton Bussab e Pedro Morettin: https://amzn.to/3aVs5mb Esse livro pode atender em: • Estatística Descritiva. • Probabildiade. • Estatística Inferencial: estimação e teste de hipóteses • Introdução à análise de correlação e re- gressão. 81 88 https://amzn.to/3aVs5mb https://amzn.to/3aVs5mb Anselmo Alves Estatística para Concurso 2. Para Começar estatística abaixo de zero, muito básico e tranquilo, a indicação é o livro Estatística Fácil: https://amzn.to/3lm0L5z Clique no link acima para ver por dentro do livro. 3. Se você quer aprender sobre amostragem e técnicas de amostragem o melhor livro que já estudei foi o livro Professor Heleno Bol- farine e do Professor Bussab: Elementos de Amostragem. 82 88 https://amzn.to/3lm0L5z https://amzn.to/3lm0L5z Anselmo Alves Estatística para Concurso https://amzn.to/2FuhKlN 4. Para estudar regressão o livro mais completo e mais prático para sua preparação é https://amzn.to/2FtagQ9 83 88 https://amzn.to/2FuhKlN https://amzn.to/2FuhKlN https://amzn.to/2FtagQ9 https://amzn.to/2FtagQ9 Capítulo 12 Aulas Grátis de Estatística No momento da produção de ebook temos alguns sites oferecendo cursos on line de graça: • Probabilidade: https://estatisticaparaconcurso. com/probabilidade-curso • Inferência: https://estatisticaparaconcurso. 84 88 https://estatisticaparaconcurso.com/probabilidade-curso https://estatisticaparaconcurso.com/probabilidade-curso https://estatisticaparaconcurso.com/inferencia-curso https://estatisticaparaconcurso.com/inferencia-curso https://estatisticaparaconcurso.com/inferencia-curso Anselmo Alves Estatística para Concurso com/inferencia-curso • Canal de Estatística para Concurso https:// www.youtube.com/c/concurseiroestatistico • Blog https://estatisticaparaconcurso.com • Mais materiais em http:\estatisticaparaconcurso/ instagram 85 88 https://estatisticaparaconcurso.com/inferencia-curso https://estatisticaparaconcurso.com/inferencia-curso https://estatisticaparaconcurso.com/inferencia-curso https://www.youtube.com/c/concurseiroestatistico https://www.youtube.com/c/concurseiroestatistico https://estatisticaparaconcurso.com http:\estatisticaparaconcurso/instagram http:\estatisticaparaconcurso/instagram Anselmo Alves Estatística para Concurso Quer ir direto ao ponto e já entrar na disputa por vagas de probabildiade e estatística conheça os cursos: lp.estatisticaparaconcurso/probabilidade 86 88 http://lp.estatisticaparaconcurso.com lp.estatisticaparaconcurso/probabilidade Anselmo Alves Estatística para Concurso http://bit.ly/regressao2020 O curso para a sua aprovação em estatística. Acesse Agora! 87 88 http://bit.ly/regressao2020 http://bit.ly/regressao2020 h�ps://estatisticaparaconcurso.com Estatística para Concurso™2020 Conteúdo Estatística Descritiva Coeficiente de Assimetria de Pearson Medidas de Posição e Dispersão Boxplot Probabilidade Probabilidade Condicional e Independência Função de Densidade e Função de Distribuição Distribuições Especiais Estimação Intervalo de Confiança Teste de Hipóteses Fundamentos de Teste de Hipóteses Análise de Regressão Correlação e Regressão Amostragem Técnicas de Amostragem Dicas de Estudos Bibliografia Indicada Aulas Grátis de Estatística
Compartilhar