Baixe o app para aproveitar ainda mais
Prévia do material em texto
TODOS OS EXERCÍCIOS – ESTATÍSTICA APLICADA 1a Questão (Ref.: 201402663690) O site http://ultimosegundo.ig.com.br/ na matéria de 22.03.2013 (Índice de reprovação no 9º Exame de Ordem chega a quase 90%) informa que apenas 10,3% dos bacharéis em Direito foram aprovados no 9º Exame de Ordem Unificado. Dos 114.763 candidatos que prestaram a prova desde a primeira fase, 11.820 obtiveram êxito em todas as etapas (além de provas objetivas, há provas discursivas) e vão receber a carteira de advogado, exigida de quem quer atuar como tal. Os dados estatísticos consolidados do resultado final desta edição do Exame de Ordem revelam o baixo índice de aprovação já era esperado, já que apenas 18% passaram na primeira fase. Quantos candidatos passaram na primeira fase? 24.657 20.657 22.657 21.657 23.657 Gabarito Comentado. 2a Questão (Ref.: 201402716529) A estatística é uma ciência que se dedica_______________________. Preocupa-se com os métodos de recolha, organização, resumo, apresentação e interpretação dos dados, assim como tirar conclusões sobre as características das fontes donde estes foram retirados, para melhor compreender as situações à análise e interpretação de dados à interpretação de dados à coleta e interpretação de dados à coleta e análise de dados à coleta, análise e interpretação de dados Gabarito Comentado. 3a Questão (Ref.: 201402663652) O site http://ultimosegundo.ig.com.br/ na matéria de 22.03.2013 (Estudo mostra que 44% das escolas do País não têm TV ou computador) informa que grande parte das escolas brasileiras possui apenas condições mínimas de funcionamento e não oferece sequer televisores ou computadores a professores e alunos. O resultado faz parte de um estudo inédito realizado por pesquisadores da Universidade de Brasília (UnB) e da Universidade Federal de Santa Catarina (UFSC). Com base nos dados disponíveis no Censo Escolar 2011 sobre estrutura e equipamentos dos colégios, pesquisadores criaram uma escala de avaliação da infraestrutura escolar das redes pública e privada do País. Os resultados revelam que 44% das 194.932 escolas do País não têm TV ou computador. Quantas escolas brasileiras têm TV ou computador? 108.161 109.161 107.161 106.161 105.161 Gabarito Comentado. 4a Questão (Ref.: 201402501933) Uma característica que pode assumir diferentes valores de indivíduo para indivíduo é denominada variável. As variáveis podem ser classificadas por: Quantitativas e numéricas. Medianas e qualitativas. Quantitativas e qualitativas. Constantes e sistemáticas Qualitativas e modais. Gabarito Comentado. 5a Questão (Ref.: 201402500693) A parcela da população convenientemente escolhida para representá-la é chamada de: Rol. Variável. Amostra. Dados brutos. Tabela. Gabarito Comentado. 6a Questão (Ref.: 201402734905) As frases a seguir referem-se aos conceitos de Estatística: I. A Estatística Inferencial se preocupa com a organização e descrição dos dados experimentais. II. O número de alunos em uma disciplina é um exemplo de variável quantitativa contínua. III. A amostra é constituída por n unidades de observação e deve ter as mesmas características da população. IV. A faixa etária dos clientes é um exemplo de variável qualitativa. Pode-se dizer que as frases verdadeiras são APENAS: III e IV I e IV II e IV I e III I e II Gabarito Comentado. AULA 2 – 1a Questão (Ref.: 201402718037) A seguir estão apresentados os salários em reais pagos por uma organização. Classes (R$) Frequência simples (fi) 500|-------700 2 700|-------900 10 900|------1100 11 1100|-----1300 7 1300|-----1500 10 Soma 40 A frequência acumulada na quarta classe é: 30 21 12 40 23 Gabarito Comentado. 2a Questão (Ref.: 201402730541) O PONTO MÉDIO DE CLASSE (XI) É O VALOR REPRESENTATIVO DA CLASSE. PARA SE OBTER O PONTO MÉDIO DE UMA CLASSE: MULTIPLICA-SE A AMPLITUDE (A) PELO INTERVALO DE CLASSE (H) SOMA-SE O LIMITE SUPERIOR E INFERIOR DA CLASSE E DIVIDE-SE POR 2. MULTIPLICA-SE A AMPLITUDE (A) PELO VALOR DO LIMITE SUPERIOR DA CLASSE. SOMA-SE O LIMITE SUPERIOR E INFERIOR DA CLASSE E MULTIPLICA-SE POR 2. MULTIPLICA-SE A AMPLITUDE (A) PELO VALOR DO LIMITE INFERIOR DA CLASSE. Gabarito Comentado. 3a Questão (Ref.: 201403061156) 3. Em uma pesquisa junto à consumidores sobre a marca de automóvel preferida, foram obtidas as seguintes respostas: FORD - 4 (EUA) FIAT - 3 (ITÁLIA) GM - 6 (EUA) NISSAN - 1 (JAPÃO) PEUGEOT - 3 (FRANÇA) RENAULT - 2 (FRANÇA) VOLKS - 5 (ALEMANHA) Podemos então afirmar que a frequência acumulada dos veículos de montadoras de origem europeia é: 20,8% 41,7% 54,1% 41,6% 4,2% 4a Questão (Ref.: 201403063447) A distribuição de frequências é um agrupamento de dados em classes, de tal forma que contabilizamos o número de ocorrências em cada classe. O número de ocorrências de uma determinada classe recebe o nome de frequência absoluta. Considere a frequência absoluta das notas de 200 candidatos abaixo e obtenha a frequência relativa acumulada: 8-22-35-41-40-34-20. 4% - 15 % - 33,5% - 53 % - 73% - 90% - 100%. 4% - 15 % - 32,5% - 54% - 73% - 90% - 100%. 4% - 15 % - 33% - 53 % - 73% - 90% - 100%. 4% - 15 % - 32,5% - 53 % - 74% - 90% - 100%. 4% - 15 % - 32,5% - 53 % - 73% - 90% - 100%. 5a Questão (Ref.: 201402716150) Foi realizada uma pesquisa ente 800 professores do EAD da Universidade Estácio de Sá para conhecer o número de turmas que cada professor atuava como tutor, encontrando os seguintes valores: até 5 turmas (40 professores), 6 a 10 turmas (120 professores), 11 a 15 turmas (200 professores), 16 a 20 turmas (240 professores, 20 a 25 turmas (200 professores). Assim, o percentual de professores que têm no mínimo 11 turmas é de: 95% 20% 55% 80% 25% Gabarito Comentado. 6a Questão (Ref.: 201402664484) Cinco elementos constavam da elaboração de uma tabela: 1. intervalo de classe; 2. Amplitude; 3. média aritmética da distribuição; 4. limites de classe e 5. ponto médio da classe. O elemento que NÃO CONSTA da elaboração de uma tabela é: limites de classe intervalo de classe ponto médio da classe amplitude média aritmética AULA 3- 1a Questão (Ref.: 201402735234) Se 5, 8, 6, 2 ocorrerem com as freqüências 3, 2, 4 e 1, respectivamente, a média será? Média= Somatório ( Dado * Frequência) / Total de Elementos 6,8 5,7 7,0 3,9 4,5 2a Questão (Ref.: 201402717788) Em uma avaliação os alunos de uma classe tiraram as seguintes notas: 8 ;4 ; 9 ; 10 ; 5 ; 6 ; 7 ; 9 ; 8 ; 4 ; 6 ; 10 ; 9 ; 6 e 9. Portanto, de acordo com as alternativas abaixo, assinale a nota mediana. Nota Mediana= Nota 7. Nota Mediana=Nota 4. Nota Mediana= Nota 9. Nota Mediana= Nota 8. Nota Mediana=Nota 10. Gabarito Comentado. 3a Questão (Ref.: 201402663974) Umaplicador em bolsa de valores comprou 10.000 ações ao preço unitário de R$ 6,00 e depois comprou mais uma certa quantidade de ações ao preço unitário de R$ 5,00, obtendo um preço médio unitário de R$ 5,20. Qual foi a quantidade de ações que o aplicador comprou ao preço unitário de R$ 5,00. 45.000 ações 35.000 ãções 20.000 ações 40.000 açoes 30.000 ações Gabarito Comentado. Gabarito Comentado. 4a Questão (Ref.: 201402723474) Dada a amostra : 08, 38, 65 , 50 e 95 , calcular a média aritmética : 65 50,0 52,4 52,5 51,2 Gabarito Comentado. 5a Questão (Ref.: 201402735764) Pedro é um excelente aluno e tirou 8,0; 9,2; e 9,8 em provas de Estatística com os seguintes pesos 1, 3, e 2. Calcule a média final de Pedro. 18,4 2,04 55,2 9,2 9 Gabarito Comentado. Gabarito Comentado. 6a Questão (Ref.: 201402664871) Os limites de uma classe são, respetivamente, 3 e 9. Ao calcular o ponto médio da classe, obtém-se: ponto médio = 4,5 ponto médio = 12 ponto médio = 6 ponto médio = 5,5 ponto médio = 7 Gabarito Comentado. AULA 4 – 1a Questão (Ref.: 201402736241) João cursa o 2º ano do Ensino Médio e obteve notas 8,5; 5,0 e 6,5 em três trabalhos realizados, qual deve ser a nota do quarto trabalho para que a média aritmética dos quatro seja 6,0? 6,0 6,5 4,5 4,0 5,0 Gabarito Comentado. 2a Questão (Ref.: 201402716542) As medidas - os quartis, os decis e os percentis - são, juntamente com a __________, conhecidas pelo nome genérico de separatrizes. Mediana Variância Moda Media ROL Gabarito Comentado. 3a Questão (Ref.: 201402663967) Quartis são separatrizes que dividem uma distribuição de dados ordenados em 4 partes iguais. No primeiro quartil 25% dos dados estão abaixo e 75% acima dele, no segundo 50% abaixo e 50% acima dele e no terceiro 75% abaixo e 25% acima dele. A fórmula é dada por Qnq = X (nqn/4 + 0,5), ou seja, é o valor de X com o índice de X dado por (nqn/4 + 0,5), sendo n o quartil (pode ser 1, 2 ou 3) e qn o número de dados. Portanto, se tivermos 11 dados, o segundo quartil será: Q2 = X (2. 11 / 4 + 0,5), ou seja, Q2 = X (5,5 + 0,5), isto é, Q2 = X(6). Em outras palavras, o segundo quartil será o sexto valor de 11 valores ordenados. Assim, se tivermos 10 dados (2, 4, 6, 8, 10, 12, 14, 16, 18, 20) ordenados, o primeiro e o terceiros quartis serão, respectivamente: 6,5 e 17,5 6 e 17 6 e 18 6,5 e 18,5 6 e 16 Gabarito Comentado. 4a Questão (Ref.: 201402663972) Foram obtidas duas amostras, sendo a primeira com 20 elementos e a segunda com 25 elementos. Na primeira (A), a média foi igual a 100 e a amplitude total igual a 4 (102 - 98 = 4) e na segunda (B) a média foi igual a 200 e a amplitude total igual a 4 (202 - 198 = 4) também. Destes valores, aponte a única alternativa correta: Somente na amostra A o desvio padrão será menor do que 4 A variância pode ser maior do que 16 na amostra A Com certeza, o desvio padrão será menor do que 4 em ambas as amostras A variância pode ser maior do que 16 em uma das duas amostras A variância pode ser maior do que 16 na amostra B 5a Questão (Ref.: 201402664923) O quartil 2 do conjunto de dados 13 / 17 / 20 / 23 / 27 / 30 é 21,5, logo ele é igual: ao decil 10 à média à mediana ao percentil 25 à moda Gabarito Comentado. 6a Questão (Ref.: 201402726318) Em um campeonato de tiro ao alvo cada participante tem direito a 5 tiros. A tabela abaixo mostra quantos competidores obtiveram determinada quantidade de acertos. Qual o segundo quartil da distribuição? 2 2,5 3 3,5 4 Gabarito Comentado. Gabarito Comentado. AULA 5 – 1a Questão (Ref.: 201402717873) Três Universitários tiraram as seguintes notas: Estudante A - 7 , 5 , 3 Estudante B - 5 , 4 , 6 Estudante C - 4 , 4, 7 . O Estudante que obtiver o menor resultado no cálculo do Desvio Padrão, possui uma melhor regularidade nas notas. Logo, assinale a alternativa que identifica a melhor regularidade nas notas, baseada no cálculo do Desvio Padrão: B) O Aluno C obteve o menor resultado no cálculo do Desvio Padrão. E) O Aluno B possui o menor resultado no cálculo do Desvio Padrão, obtendo uma melhor regularidade nas notas. C) O resultado do cálculo do Desvio Padrão dos alunos A e B foram iguais. D) Como a média dos dados são iguais, podemos afirmar que o Desvio Padrão é Nulo. A) Todos os alunos obtiveram o mesmo resultado no cálculo do Desvio Padrão. Gabarito Comentado. Gabarito Comentado. 2a Questão (Ref.: 201402731278) As três principais características de um conjunto de dados são: I - Um valor representativo do conjunto de dados: Medidas de Tendência Central. II - Uma medida de dispersão ou variação. III - A natureza ou forma da distribuição dos dados: sino, uniforme, assimétrica,... (Tabelas de frequência e histograma). Com base nas afirmações acima, podemos concluir: todas as afirmações são verdadeiras somente as afirmações I e II são verdadeiras somente as afirmações II e III são verdadeiras somente a afirmação II é verdadeira somente as afirmações I e III são verdadeiras Gabarito Comentado. Gabarito Comentado. 3a Questão (Ref.: 201402723480) Dada a amostra : 05, 10, 15 , 20 e 25 , calcular o desvio padrão : 15,87 20,00 25,00 2,36 7,91 Gabarito Comentado. Gabarito Comentado. 4a Questão (Ref.: 201403062907) Um pesquisador calculou o desvio padrão de uma distribuição de frequência, obtendo 0,8943. Se o desvio padrão da distribuição é 0,8943, sua variância é: 0,9457 0,7998 0,7697 0,9542 0,8318 Gabarito Comentado. 5a Questão (Ref.: 201402496878) Uma determinada empresa tem 5 estagiários que recebem os seguintes salários: $600; $650; $650; $550 e $675. Se for contratado mais um estagiário com salário de $625, é correto afirmar sobre as medidas de tendência central da distribuição salarial dos estagiários que: A mediana irá reduzir e tanto a média quanto a moda não sofrerão alteração. A mediana sofrerá redução, a média se manterá igual e a moda irá aumentar. A média salarial sofrerá alteração, porém a mediana e moda terão sensíveis reduções. A média não sofrérá alteração, porém a mediana e a moda irão reduzir. A moda sofrerá alteração, a média se manterá igual e a mediana irá aumentar. 6a Questão (Ref.: 201403062981) Em relação às medidas de variabilidade, podemos afirmar que: O desvio padrão é dado pelo quadrado da variância. A variância e o desvio padrão são iguais quando se trata de dados não agrupados. A variância é normalmente maior do que o desvio padrão. O desvio padrão é normalmente maior do que a variância. A variância é dada pela raiz quadrada do desvio padrão. Gabarito Comentado. AULA 6 – 1a Questão (Ref.: 201402752674) A BARRA MAIS ALTA CARACTERIZA O PÚBLICO ALVO.ESSA DEFINIÇÃO PERTENCE A(O): Setores Barras Colunas Histograma Pictograma Gabarito Comentado. 2a Questão (Ref.: 201403059255) Foi feito um experimento com 3 tipos de produtos para eliminação de fungos. O resultado do experimento foi resumido no gráfico abaixo, onde o eixo vertical representa o percentual de fungos vivos e o eixo horizontal o tempo de exposição ao produto em horas. Pela análise do gráfico, podemos afirmar que ao utilizar o produto do tipo 3 foram eliminados exatamente 50% dos fungos entre 5 e 6 horas de exposição entre 2 e 3 horas de exposição entre 4 e 5 horas de exposição entre 6 e 7 horas de exposição entre 3 e 4 horas de exposição 3a Questão (Ref.: 201402503257) A sequência de valores: 600, 900, 800, 600, 500 representa os salários de cinco pessas de um estabelecimento comercial. Em relação à referida série, verifique qual é a verdadeira: A média da série é 600. A moda da série é 600. A média da série é igual a mediana. Se dividirmos todos os valores por 10, a média não se altera. A mediana da série é 700. Gabarito Comentado. 4a Questão (Ref.: 201402673709) O psiquiatra Içami Tiba diz que amor em excesso não é bom na educação dos filhos. A revista Veja quis saber se os leitores concordam com essa afirmação. O resultado: Considerando que o diagrama representa os percentuais de respostas de 3700 pessoas, o número de pessoas que discordam do psiquiatra é: 2960 3560 2886 3145 2775 Gabarito Comentado. 5a Questão (Ref.: 201402673719) As figuras apresentam dados referentes aos consumos de energia elétrica e de água relativo a cinco máquinas industriais de lavar roupa comercializadas no Brasil. A máquina ideal, quanto a rendimento econômico e ambiental, é aquela que gasta, simultaneamente, menos energia e água. Com base nessas informações, conclui-se que, no conjunto pesquisado: a quantidade de energia elétrica consumida pela máquina de lavar roupa é inversamente proporcional à quantidade de água consumida por ela. a máquina I é ideal, de acordo com a definição apresentada a máquina que menos consome energia elétrica não é a que consome menos água. a máquina que mais consome energia elétrica não é a que consome mais água. quanto mais a máquina de lavar roupa economiza água, mais ela consome energia elétrica. 6a Questão (Ref.: 201402673721) O gráfico representa a taxa de desemprego na grande São Paulo, medida nos meses de abril, segundo o Dieese: Analisando o gráfico, podemos afirmar que a maior variação na taxa de desemprego na Grande São Paulo ocorreu no período de: abril de 1997 a abril de 1998 abril de 2001 a abril de 2002 abril de 2000 a abril de 2001 abril de 1995 a abril de 1996 abril de 1985 a abril de 1986 Gabarito Comentado. AULA 7 – 1a Questão (Ref.: 201402735246) Consideremos a distribuição de frequência relativas ao número de acidentes em um estacionamento. Qual a possibilidade de ocorrer um acidente? 90% 75% 1,25% 7,5% 12,5% Gabarito Comentado. Gabarito Comentado. 2a Questão (Ref.: 201402561467) Dentre as alternativas não faz parte da medida de tendência Central, apenas: média aritmética mediana a média moda o desvio padrão Gabarito Comentado. 3a Questão (Ref.: 201402566202) Um grupo de 200 alunos de uma escola tem estatura média de 159,8 com um coeficiente de variação de 4,2%. Qual o desvio padrão desse grupo? (Coef. Variação é a razão entre o desvio padrão e a média aritmética) 7,20 5,71 4,2 7,02 6,71 Gabarito Comentado. 4a Questão (Ref.: 201402568570) Num teste de Conhecimentos Gerais, a média das questões certas foi de 67,3 e o desvio padrão 5,6. O coeficiente de variação, ou seja, a variabilidade relativa das classes foi de: 6,73% 12,11% 8,32% 11,23% 5,6% Gabarito Comentado. 5a Questão (Ref.: 201402566204) Qual é a média aritmética de Estatística dos alunos cujo desvio padrão é 1,5 e o Coeficiente de Variação é igual a 20,83%? 6,1 6,5 8,3 5,0 7,2 6a Questão (Ref.: 201402718042) A quantidade comercializada de um determinado produto no último ano segue a distribuição normal com média de 3400 unidades, por revenda, e desvio-padrão de 200 unidades. Considerando a possibilidade de que um grande número de revendas poderá comercializar o referido produto determine o erro padrão da média para uma amostra de tamanho16. 55 60 40 45 50 Gabarito Comentado. Gabarito Comentado. AULA 8 – 1a Questão (Ref.: 201402726347) Sobre intervalos de confiança, é correto afirmar que: Representa os limites inferior e superior de onde se espera que a amplitude da amostra esteja localizada. Representa os limites inferior e superior de onde se espera que a média esteja localizada. Representa os limites inferior e superior de onde se espera que o desvio padrão esteja localizado. Representa os limites inferior e superior de onde se espera que a variância esteja localizada. Representa os limites inferior e superior de onde se espera que o erro amostral esteja localizado. Gabarito Comentado. Gabarito Comentado. 2a Questão (Ref.: 201402566003) O gráfico a seguir foi montado por um síndico de um condomínio para analisar os gastos com o consumo de energia. De acordo com o gráfico podemos afirmar que o percentual de casas que gastam igual ou menos que 1200 kWh é igual a: 91,36% 95,36% 15,21% 85,20% 98,23% 3a Questão (Ref.: 201402564200) O Serviço de Defesa Social de certo Estado mostrou em seus relatórios o cenário da violência registrado no ano passado. Dividiu-se a análise em 6 períodos de 4 horas cada e verificou-se que a maior incidência de violência ocorreu entre 00:00 h e 04:00h, com 35% dos casos e a menor entre 08:00 h e 12:00 h, com 5%. As duas últimas faixas de horários do dia apresentavam o mesmo percentual, com 15%. Nas outras duas faixas, uma apresentou o dobro de percentual da outra. Qual o percentual apresentado por uma delas na parte da manhã, se é a menor entre as duas ? 25% 10% 20% 15% 17% Gabarito Comentado. 4a Questão (Ref.: 201402752678) A Distribuição Normal é utilizada em Estatística em diversas pesquisas. Podemos conhece-la também por uma Distribuição relacionada a um grande Matemático. Logo, marque a opção correta: Distribuição de Poisson Distribuição de Testes de Hipóteses Distribuição Paramétricas Distribuição Gaussiana Distribuição Contínua Gabarito Comentado. 5a Questão (Ref.: 201402499949) Qual é o gráfico mais apropriado para os dados da tabela abaixo: Gráfico em setores. Gráfico box-plot. Histograma. Diagrama de dispersão. Diagrama de pontos. Gabarito Comentado. 6a Questão (Ref.: 201402564189) Umapesquisa foi realizada em um shopping Center, na qual se constatou que entre os entrevistados, 20% aprovavam o sabor "pimenta", entre três apresentados para um novo creme dental. O sabor "pitanga" obteve a maior aceitação, com 70%. Cada entrevistado só podia escolher um único sabor, entre os oferecidos. Todas as 20 crianças participantes, sem exceção, escolheram "pistache". Quantas pessoas participaram da pesquisa? 40 participantes 100 participantes 60 participantes 200 participantes 150 participantes Gabarito Comentado. AULA 9 – 1a Questão (Ref.: 201403063552) Consultando a Tabela da Distribuição Normal verifica-se que P(0 ≤ Z ≤ 3) = 0,4987. Sabendo disso, determine a probabilidade para Z ≥ 3. 0,4987 1 0,9987 0,0013 0,5 2a Questão (Ref.: 201402758486) A empresa Alpha é a única fornecedora de um tipo especial de freio para caminhões. A quantidade em estoque desse produto segue uma distribuição normal com média de 200 unidades e desvio padrão 20. Sabe-se a probabilidade de encontrar um valor entre a média e 220 unidade é 34,13% (valor encontrado na tabela de curva normal reduzida). Qual a probabilidade de, em dado momento, o estoque da empresa apresentar mais de 220 unidades? 68,26% 34,1% 13,60% 84,13% 15,87% Gabarito Comentado. 3a Questão (Ref.: 201402735220) Suponhamos que uma nota média de estudantes em uma prova foi de 6 com desvio padrão de 1,5. Para calcular probabilidades associadas à distribuição normal, usa-se um artifício. Sabe-se que, se X tem distribuição normal com média e desvio padrão, a variável Z. Esta variável corresponde : Z=(Xi-Média) / DP. Calcular o percentual de alunos com média entre 4,5 e 7,5. 34,13% 40% 69,15 % 70% 68,26% Gabarito Comentado. https://v3.webcasters.com.br/visualizador.aspx?CodTransmissao=305179 4a Questão (Ref.: 201403056752) As notas de uma prova de Comércio Exterior tiveram comportamento de uma curva de Distribuição Normal com média de 5,0 e desvio-padrão de 1,0. Qual será o percentual de alunos que obtiveram nota entre 4,0 e 6,0? Obs : Z(1)=0,3413 68,26% 87,13% 95,44% 34,13% 15,87% 5a Questão (Ref.: 201402735773) Um aluno tirou 9,5 numa prova de Estatística, sendo que a média da turma foi de 8,1, e o desvio padrão foi de 0,8. Considerando que as notas apresentaram uma Distribuição Normal, calcule o valor padronizado de Z (escore-z). +1,75 +1,27 -1,07 +1,07 -1,75 6a Questão (Ref.: 201402541416) A parcela da população convenientemente escolhida para representá-la é chamada de: Rol. Amostra. Dados brutos. Variável. Tabela. Gabarito Comentado. AULA 10 – 1a Questão (Ref.: 201403083658) Inferência estatística é um ramo da Estatística cujo objetivo é fazer afirmações a partir de um conjunto de valores representativo (amostra) sobre um universo. Tal tipo de afirmação deve sempre vir acompanhada de uma medida de precisão sobre sua veracidade. Para realizar este trabalho o estatístico coleta informações de dois tipos, experimentais (as amostras) e aquelas que obtêm na literatura. As duas principais escolas de inferência são a inferência frequentista (ou clássica) e a inferência bayesiana. Qual o motivo se usa a Inferência Estatística ? induzir o resultado de uma pesquisa tirar conclusões acerca da população usando informação de uma amostra organizar os dados de uma tabela montar a tabela de distribuição normal aproximar o valor do desvio padrão quando não é conhecido 2a Questão (Ref.: 201402735814) As frases a seguir referem-se aos conceitos de testes paramétricos e não paramétricos: I. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão. II.São exemplos de modelos de testes não paramétricos, os testes de média, mediana e moda. III.Os testes não paramétricos não dependem de parâmetros populacionais e de suas respectivas estimativas amostrais. IV. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, Testes de Wilcoxon, e Teste de Kruskal- Wallis . Pode-se dizer que as frases verdadeiras são APENAS: III e IV I e IV I e II I e III II e IV Gabarito Comentado. 3a Questão (Ref.: 201403058188) Uma determinada empresa anunciou que a média de salários em uma linha de produção nos últimos 3 meses foi de R$ 9.000,00. Uma empresa de pesquisa extraiu uma amostra aleatória de 50 colaboradores daquele grupo, encontrando um salário médio de R$ 8.200,00, com desvio-padrão de R$ 1.000,00. Teste a afirmação da empresa, contra a alternativa de que o salário médio é inferior a R$ 9.000,00, com um nível de significância de 5%. Como z = - 5,66 a hipótese nula não será rejeitada. Como z = - 9,67 a hipótese nula será rejeitada. Como z = - 0,17 a hipótese nula não será rejeitada. Como z = - 5,66 a hipótese nula será rejeitada. Como z = - 0,67 a hipótese nula não será rejeitada. 4a Questão (Ref.: 201402716559) O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectiva distribuição da variável em estudo. Testes paramétricos são baseados nos seguintes parâmetros da amostra: Moda e desvio padrão Media e moda Média e desvio padrão. Mediana e Moda Mediana e desvio padrão Gabarito Comentado. 5a Questão (Ref.: 201403058204) Uma associação de empresas da indústria da construção em nosso município anunciou que a média de comunicações de acidentes ou doenças do trabalho por ano, nos últimos 5 anos, foi de 60 comunicações. Foi então realizada uma pesquisa que utilizou uma amostra de 49 empresas desse segmento e medido o número médio de 58 comunicações de acidentes ou doenças, com um desvio-padrão de 20 comunicações. Considerando um teste de hipótese com um nível de significância de 5%, assinale a afirmativa correta: Como z = - 1,7 a hipótese nula será rejeitada. Como z = 1,7 a hipótese nula será rejeitada. Como z = - 0,7 a hipótese nula será rejeitada. Como z = - 1,7 a hipótese nula não será rejeitada. Como z = - 0,7 a hipótese nula não será rejeitada. 6a Questão (Ref.: 201402718045) O Teste de Hipóteses pode ser feito através de duas formas testes paramétricos e testes não paramétricos. Os testes não paramétricos envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal. Assinale a alternativa que não representa um teste não paramétricos. Teste dos Sinais Teste de Mann Whitney Teste do Qui-Quadrado Teste de Wilcoxon Teste da moda ESTATÍSTICA APLICADA Tutor: Antonio Viana Professor da teletrasmitida: Eudes AULA 1-CONCEITOS INTRODUTÓRIOS A Estatística é uma parte da Matemática Aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Fases do método estatístico Coleta de dados: Após cuidadoso planejamento e a devida determinação das características mensuráveis do fenômeno que se quer pesquisar, damosinício à coleta dos dados numéricos necessários à sua descrição. Crítica dos dados: Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de falhas e imperfeições. Apuração dos dados: Soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. Exposição ou apresentação dos dados Os dados devem ser apresentados sob a forma adequada (tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento estatístico e ulterior obtenção de medidas típicas Análise dos resultados: O objetivo último da Estatística é tirar conclusões sobre o todo (população) a partir de informações fornecidas por parte representativa do todo (amostra). Assim, realizadas as 4 fases anteriores (Estatística Descritiva), fazemos uma análise dos resultados obtidos através dos métodos da Estatística Indutiva ou Inferencial, e tiramos desses resultados conclusões e previsões. População estatística ou universo estatístico: Conjunto de entes portadores de, pelo menos, uma característica comum Amostra é um subconjunto finito de uma população Variável: É, convencionalmente, o conjunto de resultados possíveis de um fenômeno. Variável é, pelo menos, uma característica que possa ser observada ou medida nos elementos de uma população. Quantitativa (Ou atributo) Expresso por atributos Gênero, Sexo, Faixa Etária, Estado civil, Escolaridade Religião; católico, umbandista, etc Naturalidade Cor dos olhos, da pele, do cabelo Qualitativa Expressa em números Discretas (Intervalo de um número real inteiro, contagens, enumerações, valores inteiros) Valores de uma moeda R$1, R$5 Sabores de um refresco: manga, limão Nº de alunes de uma classe Nº Viagens feitas Nº de filhos de uma família Contínuas (Medições, valores dentro de intervalos) Temperatura Altura, peso, comprimento, espessura, velocidade Renda R$1.360,00 Idade; 01 ano e 3 meses Tempo de vôo Duração de bateria de celular Técnicas de Amostragem AULA 2 _TIPOS DE DADOS Dados brutos são aqueles que ainda não foram numericamente ordenados. Como são dados primariamente levantados ou reunidos, possui uma característica aleatória. Rol é um arranjo de dados numéricos brutos em ordem crescente ou decrescente de grandeza. Frequencias_Elementos de distribuição de frequencias X = Maior valor observado da variável de freqüências MAX x = Menor valor observado da variável de freqüências MIN h= Intervalo de classe Diferença entre o limite superior e o limite inferior de classe A= Amplitude Diferença entre o limite superior e o limite inferior de classe AT = Amplitude Total = maior dado – menor dado = 15 – 4 = 11 4 6 6 10 12 12 13 13 14 14 15 15 16 19 19 20 AT = 20 - 4 Xi = Ponto médio de classe Valor representativo da classe Para obter o ponto médio de uma classe, some os limites superior e inferior e divida por 2 Limite de classe: Valores extremos. O limite mínimo de uma classe é denominado “limite inferior” e o máximo, “limite superior” fri Frequência Relativa (%) Frequência Relativa de um elemento da série – fr É a divisão da frequência simples de um elemento da série pelo total de elementos da série Apresenta a participação percentual do elemento na série. fri = fi / n Fi Frequência Acumulada Soma das freqüências simples de classe com as freqüências simples da classe antecedente Fi = f1+f2+f3+f4...fi Fri Frequência Acumulada Relativa (%) Divisão da freqüência acumulada (Fi) da classe pelo total dos elementos Fri = Fi / n Elaborando uma tabela de distribuição de freqüências Transformar os dados em rol Encontrar a amplitude total Determinar o número de classes de acordo com o total de observações Xi fi fri fi/n Fi fi1+ fi2+ fi3+... Fri fi / n 2 3 =3/25 12 Repete fi 3 Repete fri 12 3 7 =7/25 28 =3+7 10 12+28 40 4 8 =8/25 32 =10+8 18 40+32 72 6 6 =6/25 24 =18+6 24 72+24 96 7 1 =1/25 4 =24+1 25 96+4 100 n= 25 Ponto Médio Classe Intervalo de classe fi fri fi/n Fi fi1+ fi2+ fi3+... Fri fi / n 1 2 ___________4 6 15 6 15 2 4 ___________6 18 45 24 60 3 6 ___________8 10 25 34 85 4 8 ___________10 6 15 40 100 n = 40 Limite inferior (lim superior + limite superior) / 2 1ª classe = (4+2) / 2 = 3 4ª classe = (8+10) / 2 = 9 AULA 3 _ MEDIDAS DE TENDÊNCIA CENTRAL Uma medida de tendência central ou posição de um conjunto de dados mostra o valor em torno do qual se agrupam as observações. Dividem-se em: 1. Média Aritmética 2. Mediana 3. Moda Média Aritmética: Uma média aritmética pode ser Simples, Ponderada ou Agrupada em Classe Média Aritmética Simples: é média aritmética, ou média, de um conjunto de N números X1, X2, ...., Xn é definido por: Exemplo: Sabe-se que a produção leiteira diária da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para a produção média da semana: Média Aritmética Com a Frequência Absoluta: A média é obtida através da multiplicação do valor de cada classe pela frequência simples correspondente xi fi Fi fr % Fri% X= (142x6)+(146x4)+(150x3)+(154x2)+(158x5)= 2984= 149,20 --------------------------------------------------------- ------- 20 20 142 6 6 30 30 146 4 10 20 50 150 3 13 15 65 154 2 15 10 75 158 5 20 25 100 ∑ 20 - 100 - Média Aritmética com Dados Agrupados: O modo mais prático de obtenção da média com os dados agrupados é abrir, na tabela, uma coluna correspondente aos produtos xifi: Média aritmética com a freqüência relativa: A média é obtida através da multiplicação do valor de cada classe pela frequência relativa correspondente xi fi Fi fr % Fr% X= (142 x 0,30)+(146 x 0,20)+(150 x 0,15)+(154 x 0,10)+(158 x 0,25)= X= 42,60 + 29,20 + 22,50 + 15,40 + 39,50= 149,20 142 6 6 30 30 146 4 10 20 50 150 3 13 15 65 154 2 15 10 75 158 5 20 25 100 ∑ 20 - 100 - Média Aritmética Com Intervalos De Classe Graficamente podemos observar facilmente a moda. O valor modal localiza-se na parte mais alta da curva onde a frequência tem o maior valor. Moda Com Intervalo De Classe l* é o limite inferior da classe modal L* é o limite superior da classe modal Mediana é o valor que divide a distribuição em duas partes iguais. Sua fórmula é: Mediana Dados Não-agrupados Dada uma série de valores, como por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9 De acordo com a definição de mediana, o primeiro passo a ser dado é ordenar os valores: 2, 5, 6, 9, 10, 13, 15, 16, 18. Md = 10 Número ímpar: É o valor do item médio ou central. Ex.: 4; 7; 8; 9; 12; 13; 17 A mediana é 9. Número par: Quando os números são pares tem-se dois elementos centrais e a mediana será a média aritmética. Ex.: 4; 7; 8; 10; 12; 13; 17; 20 A mediana será: (10 + 12) = 22 = 11 2 Mediana: Dados Agrupados Sem Intervalos De Classe Identificar a frequência acumulada imediatamente superior à metade da soma das frequências. A mediana será aquele valor da variável que corresponde a tal frequência acumulada. Nº de meninos fi Fi Sendo: (∑ fi) ÷ 2 = 34 ÷ 2 = 17 Md = 2 meninos 0 1 2 3 4 2 6 10 12 4 2 8 18 30 34 ∑ = 34 No caso de existir uma frequência acumulada (F1), tal que: Fi = (∑ f1) ÷ 2 A mediana será dada por:Md = [(xi + xi + 1)] ÷ 2 xi fi Fi Sendo: (∑ fi) ÷ 2 = 8 ÷ 2 = 4 Logo: Md = (15 + 16) ÷ 2 = 31 ÷ 2 15,5 Md = 15,5 meninos 12 14 15 16 17 20 1 2 1 2 1 1 1 3 4 6 7 8 ∑ = 8 Mediana com intervalo de classe Mediana Para Dados Agrupados Salários f (nº de pessoas) xi Fi 1º passo : Localizar o ponto que contém a mediana. n = 40 temos: n/2 = 40:2 = 20 (Na 3ª classe, temos Fi = 24) 1º passo: Calcula-se a ordem n/2. 2º passo: Pela Fi identifica-se a classe que contém a mediana (Classe Md = 30 40 ). 3º Passo: utiliza-se a fórmula. 10 20 5 15 5 20 30 8 25 13 30 40 11 35 24 40 50 9 45 33 50 60 4 55 37 60 70 3 65 40 S 40 ----- AULA 4 _ MEDIDAS DE ORDENAMENTO E FORMA Na análise da distribuição de uma variável, há grande interesse de determinarmos qual o valor que divide a distribuição em duas partes iguais, quatro partes iguais, dez partes iguais e cem partes iguais. A estes valores (separatrizes) chamaremos respectivamente de: Quartil: Denominamos quartis os 3 valores de uma série que a dividem em 4 partes iguais. Há três quartis: o primeiro quartil; o segundo quartil (igual à mediana); o terceiro quartil. Dividem a distribuição em quatro partes iguais. Sua fórmula: Qnq = X ( nqn / 4 + ½) _____________________________________________________ 0% 25% 50% 75% 100% Qnq = Primeiro, segundo e terceiro quartil (i = 1,2 e 3) nq = nº do quartil que se quer X = elemento da série ordenada n = tamanho da amostra Q1 Q2 Q3 2ºQuartil Mediana Sendo que Q2 (segundo quartil) é igual à mediana da série. Decil: Denominamos quartis os 9 valores de uma série que a dividem em 10 partes iguais. Dividem a distribuição ordenada em dez partes iguais. Sua fórmula é: Qnq = X ( nqn / 10 + ½) ___________________________________________________________ d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 mediana O quinto decil é igual ao segundo quartil, que por sua vez é igual à mediana. Percentil: Denominamos percentis os 99 valores que separam uma série em 100 partes iguais. Dividem a distribuição ordenada em dez partes iguais. Sua fórmula é: Qnq = X ( nqn / 10 + ½) ___________________________________________________________ d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 mediana O quinquagésimo centil é igual à mediana. AULA 5 _ MEDIDAS DE DISPERSÃO Nem sempre, quando se está estudando um grupo de dados, o conhecimento de um promédio é suficiente para se tirar conclusão a respeito desses dados. É necessário também o conhecimento da variabilidade dos dados. Assim, é que não se justifica calcular a média de um conjunto de dados onde não haja nenhuma variação desses elementos. Da mesma forma, não ajuda muito o conhecimento da média quando o conjunto de dados tiver uma variação muito grande. A tomada de decisões apenas com a média, por exemplo, de um conjunto de dados é inadequada, uma vez que os dados diferem entre si, em maior ou menor grau. As medidas de tendência central (Média. Moda e Mediana) fornecem um resumo parcial das informações de um conjunto de dados. A necessidade de uma medida de variação é aparente, para que nos permita, por exemplo, comparar conjuntos diferentes de valores. Variância: É a média dos quadrados dos desvios das observações em relação à média da amostra. Pode ser definida como uma medida de dispersão que é o quadrado do desvio padrão, ou se preferir, o desvio padrão é a raiz quadrada da variância. Habitualmente considera-se uma versão corrigida da variância Desvio Padrão: O desvio padrão de um conjunto de N números X1, X2, ... A variância não vem representada na mesma unidade das observações. Se tomarmos a raiz quadrada da variância obtemos o desvio padrão que também é uma medida de dispersão e vem na mesma unidade das observações. Nos programas de estatística e nas máquinas de calcular o que aparece são as versões corrigidas da variância e do desvio padrão. O desvio padrão e a variância podem ser fortemente afetados por erros ou observações muito afastadas Propriedades do Dp: Somando-se ou subtraindo-se uma constante a cada elemento de um conjunto de números, o desvio padrão não se altera. Multiplicando-se ou dividindo-se cada elemento de um conjunto de números por uma constante, o desvio padrão fica multiplicado ou dividido pela constante. Amplitude total: A amplitude de uma amostra é a diferença entre o máximo e o mínimo. Exemplo: Para os valores 40,45,48,52,54,62 e 70, temos que AT = 70 – 40 = 30 Quanto maior a amplitude total, maior a dispersão ou variabilidade dos valores da variável. Coeficiente De Variação: Podemos caracterizar a dispersão ou variabilidade dos dados em termos relativos a seu valor médio, medida essa denominada coeficiente de variação (CV). Corresponde à relação entre o desvio padrão sobre a média. Considere os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivíduos: Método prático: Não apenas este método é usualmente mais prático, como também mais preciso 1º caso: dados não-agrupados Tomemos como exemplo o conjunto de valores da variável x: 40, 45, 48, 52, 54, 62, 70. O modo mais prático para se obter o desvio padrão é formar uma tabela com duas colunas: uma para xi e outra para xi² 2º caso: dados agrupados sem intervalos de classe Como, neste caso, temos a presença de frequências, temos que levá-las em consideração, resultando a fórmula: O modo mais prático de obter o desvio padrão é abrir, na tabela dada, uma coluna para os produtos fixi e outra para fixi². Logo, considerando os dados da tabela anterior, temos que: 3º caso: dados agrupados com intervalos de classes AULA 6_ TABELAS E GRÁFICOS O gráfico estatístico é uma forma de apresentação dos dados estatísticos, cujo objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e viva do fenômeno em estudo, já que os gráficos falam mais rápido à compreensão que as séries. Os gráficos podem ser classificados quanto á forma e quanto ao uso Para a elaboração de um gráfico devem ser considerados: a) Um título geral indicando a situação estudada, época e local; b) escalas e as respectivas unidades de medida; c) convenções adotadas; d) fonte de informação assinalando de onde foram retirados os valores. Tipos de Gráficos 1. Gráfico de Colunas: Representação por meio de retângulos não-contíguos, dispostos verticalmente; Os retângulos possuem a mesma base e as alturas são proporcionais aos respectivos dados; É usado em séries temporais, específicas ou geográficas. => (gráfico de colunas compostas) 2. Gráfico em Barras: Representação por meio de retângulos dispostos horizontalmente; Os retângulos possuem mesma altura e os seus comprimentos são proporcionais aos respectivos dados. => (gráfico de colunas compostas) 3. Gráficos em setores: É designado por meio de um círculo, onde cada classe é representado por um setor circular, cujo ângulo é proporcional ao tamanho da amostra. É utilizado quando se deseja mostrar as partes de um todo, ou seja, quando se deseja comparar proporções. As áreas dos setores são proporcionais aos dados da série e a área total da circunferência (100%) corresponde a 360º. 360o 100% 4. Gráfico de linhas São usados, sobretudo, na representação de séries temporais. 5. Pictogramas Os símbolos devem ser auto-explicativos; As diferentes quantidades devem expressar-se mediante maior ou menor número de símbolos; Estabelecem comparações gerais. 6. Histograma: é um gráfico composto por retângulos justapostos em que a base de cada um deles corresponde ao intervalo de classe e a sua altura à respectiva frequência. AULA 07 _TÉCNICAS DE AMOSTRAGEM É uma técnicaespecial para recolher amostras, que garante, tanto quanto possível, o acaso da escolha. Dessa forma, cada elemento da população passa a ter a mesma chance de ser escolhido, o que garante à amostra caráter de representatividade. Amostragem Aleatória Simples É equivalente a um sorteio lotérico.Na prática, a amostragem casual ou aleatória simples pode ser realizada enumerando-se a população de 1 a n e sorteando-se por meio de um dispositivo aleatório qualquer k números dessa sequência, os quais corresponderão aos elementos pertencentes à amostra. Ex.: Obter uma amostra representativa, de 10%, de uma população de 300 alunos de uma escola. 1º) Numerar os alunos de 1 a 300; 2º) Escrever os números de 1 a 300 em pedaços de papel e colocá-los em uma urna; 3º) Retirar 30 pedaços de papel, um a um, da urna, formando a amostra da população. Nesta técnica de amostragem, todos os elementos da população têm a mesma probabilidade de serem selecionados. Amostragem Proporcional Estratificada Muitas vezes a população se divide em sub-populações (estratos). O sorteio dos elementos da amostra deve levar em consideração tais estratos. Além de considerar a existência de extratos, obtém os elementos da amostra proporcional ao número de elementos dos mesmos Ex.: Em uma população de 300 alunos, há 180 meninos e 120 meninas. Extraia uma amostra representativa, de 10%, dessa população. Nesse exemplo, há uma característica que permite identificar 2 subconjuntos, a característica Sexo. Considerando essa divisão, vamos extrair a amostra da população. Sexo População Amostra Masc 180 18 Fem 120 12 Total 300 30 Estatística Inferencial Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. Valor esperado de A média da variável aleatória de é o valor esperado de, ou seja, é a media de todas as médias possíveis para uma amostras de tamanho n de uma população. É importante saber que o valor esperado de é igual ao valor da média da população (). Assim, temos=> Não há dúvida de que uma amostra não representa perfeitamente uma população. Ou seja, a utilização de uma amostra implica na aceitação de uma margem de erro que denominaremos ERRO AMOSTRAL. Erro Amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias. Ocorrem erros não-amostrais quando: · Os dados amostrais são coletados, registrados ou analisados incorretamente. · Há uma utilização de um instrumento defeituoso durante a realização de mensurações. · Um questionário ou formulário possui questões formuladas de modo tendencioso. Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu valor através da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOSTRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários. Quanto maior o tamanho da amostra, menor o erro cometido e vice-versa. Erro Padrão Da Média Quando se obtém uma amostra aleatória de tamanho n, estima-se a média populacional. É bastante intuitivo supor que se uma nova amostra aleatória for realizada a estimativa obtida será diferente daquela primeira. Desta forma, reconhece-se que as médias amostrais estão sujeitas à variação e formam populações de médias amostrais, quando todas as possíveis amostras são retiradas de uma população. O erro padrão analisa a variabilidade de uma média. Desvio-padrão de , também denominado erro-padrão da média. Caso N 30n, usar a fórmula de população infinita. População Infinita Quando o valor de N é desconhecido ou muito grande. Se N 30n usar Fator de Correção Finita (FCF) Desvio-padrão de , também denominado erro-padrão da média. População Finita - quando o valor de N é conhecido. AULA 08 _INTERVALO DE CONFIANÇA Para compreendermos a aplicação do Intervalo de Confiança, precisamos ter noções sobre a distribuição da curva normal. Distribuição Normal: Para compreendermos a aplicação do Intervalo de Confiança, precisamos ter noções sobre a Distribuição da Curva Normal. Intervalo De Confiança A média calculada para uma amostra dificilmente será igual à média (real) da população. É possível também, estabelecer um intervalo de confiança (IC) para a média da população. O intervalo de confiança da média representa os valores limites, inferior e superior, entre os quais se espera que a “verdadeira” média da população esteja localizada. Os intervalos de confiança mais utilizados são os de 90%, , 95% e 99%, seguindo a tabela abaixo: O intervalo de confiança mais comumente empregado é o de 95% (IC 95%), que indica que, para médias obtidas de diferentes amostras da mesma população, o IC calculado inclua a verdadeira média da população em 95% das vezes Os modelos de aplicação do Intervalo de Confiança são baseados na premissa de que a distribuição normal pode ser usada com os seguintes dados: sempre a amostra deve ser igual/superior a 30; quando for menor do que 30, o desvio padrão é conhecido. Unidades de Desvio Padrão a partir da Média Proporção Verificada 1,64 90% 1,96 95% 2,58 99% O intervalo de confiança é um conjunto de valores dentro do qual a média se situa, sendo que não se pode afirmar exatamente qual é este valor, ou seja, todos têm exatamente a mesma probabilidade de ocorrência. O intervalo de confiança da média é determinado pela equação: AULA 9- DISTRIBUIÇÃO NORMAL Denomina-se distribuição normal reduzida a distribuição normal de média zero e variância. As probabilidades associadas à distribuição normal reduzida são facilmente obtidas em tabelas. Daí o interesse em estudar esse tipo particular de distribuição. Veja os exemplos nas telas seguintes! A área total sob a curva normal vale 1. Isto significa que a probabilidade de ocorrer qualquer valor real é 1. A curva é simétrica em torno da média zero. Então a probabilidade de ocorrer valor maior do que zero é 0,5. Mas qual seria a probabilidade de ocorrer valor entre zero e z = 1,25, por exemplo? Essa probabilidade é encontrada na tabela de distribuição normal. Na primeira coluna da tabela, está o valor 1,2. Na primeira linha da tabela, está o valor 5. O número 1,2 compõe, com o algarismo 5, o número z = 1,25. No cruzamento da linha 1,2 com a coluna 5, está o número 0,3944. Esta é probabilidade de ocorrer valor entre zero e z = 1,25. Qual é a probabilidade de ocorrer valor maior do que z = 1,25? Como a probabilidade de ocorrer valor maior do que zero é 0,5 e a probabilidade de ocorrer valor entre zero e z = 1,25 é 0,3944, a probabilidade pedida é: 0,5 – 0,3944 = 0,1056 ou 10,56% Como transformar uma normal qualquer em uma normal reduzida Para transformar uma curva normal em uma curva normal reduzida, devemos calcular o z equivalente aos limites desejados utilizando a fórmula: x = ponto que se deseja converter em z μ = média da normal original σ = desvio padrão da normal original Ex: A idade de um grupo de 20 pessoas segue uma distribuição normal. A média de idade do grupo é de 60 anos e o desvio-padrão é igual a 4. Qual a probabilidade de existirem pessoas com idade menor que 60 anos? Qual a probabilidade de existirem pessoas com idade maior que 60 anos? AULA 10 _TESTE DE HIPOTESES Teste de Hipóteses é um método utilizado para observarmos se determinados dados são compatíveis ou não com alguma hipótese levantada. Este procedimento estatístico tem como base a observação de uma amostra, sendo a teoria de probabilidades utilizada para verificar o comportamento de parâmetros desconhecidos numa população. O Teste de Hipóteses pode ser feito através de duas formas: Testes paramétricos e Testes não paramétricos ou testes de associação livre O uso tanto dos testes paramétricos como dos não paramétricos está condicionado à dimensão da amostra e à respectivadistribuição da variável em estudo. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão. Testes Não Paramétricos Envolvem casos em que não podemos supor características da população de onde a amostra foi extraída, como por exemplo, comportamento de distribuição normal. Conheça os principais testes não paramétricos. Os testes não paramétricos ou testes de distribuição livre, têm a mesma finalidade e se aplicam às mesmas situações que os testes paramétricos. Contudo, os testes de distribuição livre não se apoiam na hipótese de as populações que estão sendo analisadas possuam distribuição normal. Desta forma, são aplicáveis em uma gama muito maior de casos do que os testes paramétricos. Por outro lado, apesar dessa vantagem, a eficiência dos testes não paramétricos costuma ser menor, de forma que estes acabam sendo aplicados quando se mostra a inviabilidade da aplicação do correspondente teste paramétrico. Teste do Qui-Quadrado: utilizado na análise de frequências, no caso de análise de uma característica da amostra. Teste do Qui-Quadrado para Independência ou Associação: utilizado na análise de frequências, no caso de análise de duas características da amostra. Teste dos Sinais: utilizado em casos emparelhados, ou seja, submetido a duas medidas. Teste de Wilcoxon: Analisa os dados emparelhados considerando também as magnitudes encontradas. Teste de Mann Whitney: Analisa se dois grupos originam-se de populações com médias diferentes. Teste da Mediana: Análise de grupos que originam-se de populações com medianas diferentes. Teste de Kruskal-Wallis: Análise de grupos que originam-se de populações com médias diferentes. Testes Paramétricos Nos testes paramétricos, as hipóteses envolvem apenas parâmetros populacionais, como a média, a variância, uma proporção, etc. Além disso, em geral, estes testes comportam uma diversidade de suposições fortes a que o seu emprego deve subordinar-se de que são exemplo: as observações devem ser extraídas de populações com distribuição especificada; as variáveis em estudo devem ser medidas em escala intervalar, de modo a que seja possível utilizar operações aritméticas sobre os valores obtidos das amostras (adição, multiplicação, ...), etc. Testes paramétricos são baseados em parâmetros da amostra, por exemplo, média e desvio padrão. Os testes de hipóteses são sempre constituídos por duas hipóteses, a hipótese nula H0 e a hipótese alternativa H1. • Hipótese existente, ou hipótese a ser testada – H0, que sempre alega a igualdade de um determinado parâmetro. • Hipótese alternativa – H1, que sempre alega a desigualdade de um determinado parâmetro. TESTES DE HIPÓTESES Ho é chamada de hipótese nula e H1 de hipótese alternativa Em geral, a hipótese nula é feita com base no comportamento passado do produto/processo/serviços, enquanto a hipótese alternativa é formulada em função de alterações / inovações recentes. Por exemplo, podemos formular a hipótese que a produtividade é diferente de 2,5 peças/hora. Formalmente isso é escrito como: Ho é chamada de hipótese nula e H1 de hipótese alternativa Para a realização dos testes de hipóteses, temos que obedecer às seguintes etapas: Formulação do Teste de Hipótese: Hipótese Nula (H0) e Alternativa (H1). Escolha de Distribuição Normal Adequada. Selecionar o nível de significância e região crítica do teste. Estabelecer Regra de Decisão. Selecionar a amostra, calcular a Estatística de teste e interpretar seus resultados. Passo 1: Definição da Hipótese: é o estabelecimento das hipóteses: hipótese nula e hipótese alternativa Hipótese Nula (Ho): É um valor suposto para um parâmetro. Se os resultados da amostra não forem muito diferentes de Ho, ela não poderá ser rejeitada. Hipótese Alternativa (H1): É uma hipótese que contraria a hipótese nula, complementar de Ho, Essa hipótese somente será aceita se os resultados forem muito diferentes de Ho. Passo 2: Calcular a estatística do Teste: É o valor calculado a partir da amostra, que será usado na tomada de decisão. Uma maneira de tomar-se uma decisão é comparar o valor tabelado com a estatística do teste. Para o caso de testes de médias, a estatística do teste é a variável padronizada Z: Se α = 10%, uma área de 45% entre a média amostral e o limite inferior do intervalo e outra área de 45% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 90%, conforme demonstrado abaixo: Se α = 5%, teremos uma área de 47,5% entre a média amostral e o limite inferior do intervalo e outra área de 47,5% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 95%, conforme demonstrado abaixo: Se α = 1%, teremos uma área de 49,5% entre a média amostral e o limite inferior do intervalo e outra área de 49,5% entre a média amostral e o limite superior do intervalo, o que nos fornece uma área total (nível de confiança) de 99%, conforme demonstrado abaixo: Passo 3: Regra de Decisão Aceitar Ho, implica que a hipótese nula não pode ser rejeitada! Rejeitar Ho implica que temos evidências estatísticas para rejeitá-la. rofessor: SANDRO CHUN Turma: 9003/E Nota da Prova: 6,0 de 8,0 Nota do Trab.: 0 Nota de Partic.: 1 Data: 17/04/2014 17:32:21 1a Questão (Ref.: 201201418422) Pontos: 0,5 / 0,5 O site http://ultimosegundo.ig.com.br/ na matéria de 22.03.2013 (Na UnB, indígena vence estatísticas e se forma em Medicina) informa que, de acordo com o último Censo da Educação Superior divulgado pelo Ministério da Educação, de 2011, havia 9.756 indígenas matriculados no ensino superior, o que representa 1,08% da população indígena do País. Quantos indígenas NÃO estão matriculados no ensino superior? 895.577 indígenas 897.577 indígenas 896.577 indígenas 894.577 indígenas 893.577 indígenas 2a Questão (Ref.: 201201418731) Pontos: 0,5 / 0,5 Qual das variáveis abaixo é uma variável qualitativa ordinal? Nível de escolaridade Cor dos olhos Sexo Local de nascimento Estado civil 3a Questão (Ref.: 201201419229) Pontos: 0,5 / 0,5 Para elaboração de uma tabela para dados agrupados com 25 observações, o número de intervalos de classes seria: 4 3 6 5 2 4a Questão (Ref.: 201201419233) Pontos: 0,5 / 0,5 Cinco elementos constavam da elaboração de uma tabela: 1. intervalo de classe; 2. Amplitude; 3. média aritmética da distribuição; 4. limites de classe e 5. ponto médio da classe. O elemento que NÃO CONSTA da elaboração de uma tabela é: ponto médio da classe limites de classe média aritmética intervalo de classe amplitude 5a Questão (Ref.: 201201489984) Pontos: 1,0 / 1,0 Entre 100 números, vinte são 4, quarenta são 5, trintas são 6 e os restantes são 7. Determine a média dos números.------------------------------------------------------------------------------------------- Total de Elementos=Somatório da Frequência--------------------------------------------------------- Média=Somatório(Dado*Frequência)/Total de Elementos 6,2 3,9 7,1 4,5 5,3 6a Questão (Ref.: 201201283426) Pontos: 0,0 / 1,0 A média aritmética é a razão entre: Os valores extremos. Os dois valores centrais. O número de valores e o somatório deles. O somatório dos valores e o número deles. O maior número de valores repetidos. 7a Questão (Ref.: 201201490991) Pontos: 1,0 / 1,0 Luis cursa o 3º ano do Ensino Médio e obteve notas 8,5; 5,0; 6,5e 9,0 em quatro trabalhos realizados, qual deve ser a nota do quinto trabalho para que a média aritmética dos cinco seja 7,0? 4,5 6,5 5,0 4,0 6,0 8a Questão (Ref.: 201201490990) Pontos: 1,0 / 1,0 João cursa o 2º ano do Ensino Médio e obteve notas 8,5; 5,0 e 6,5 em três trabalhos realizados, qual deve ser a nota do quarto trabalho para que a média aritmética dos quatro seja 6,0? 4,0 4,5 6,0 5,0 6,5 9a Questão (Ref.: 201201295924) Pontos: 0,0 / 1,0 Os valores abaixo representam as peças Alpha em estoque nos 7 primeiros dias do mês de maio. Podemos afirmar que a média, mediana e moda são, respectivamente: Peças em estoque: 121, 129, 151, 119, 150, 150, 139 139, 119 e 120 137, 119 e 150 137, 150 e 150 119, 139 e 150 137, 139 e 150 10a Questão (Ref.: 201201490515) Pontos: 1,0 / 1,0 Se o coeficiente de variação de uma amostra foi de 0,54 , e a média apresentada foi de 3,33 , calcule o valor do desvio padrão da amostra. 6,17 0,30 4,53 0,16 1,80 Exercício: GST0308_EX_A1_201310134006 Voltar ESTATÍSTICA APLICADA 1a Questão (Ref.: 201310322978) Qual das variáveis abaixo é uma variável qualitativa nominal? Classe social Classificação de um filme Cargo na empresa Nível socioeconômico Cor da pele 2a Questão (Ref.: 201310736897) De acordo com o último Censo da Educação Superior divulgado pelo Ministério da Educação, de 2011, havia 9.756 indígenas matriculados no ensino superior, o que representa 1,08% da população indígena do País. Qual a população indígena do Brasil? site http://ultimosegundo.ig.com.br/ na matéria de 22.03.2013 903.333 indígenas 907.333 indígenas 905.333 indígenas 906.333 indígenas 904.333 indígenas 3a Questão (Ref.: 201310736899) De acordo com o levantamento de dados, apenas 10,3% dos bacharéis em Direito foram aprovados no 9º Exame de Ordem Unificado. Dos 114.763 candidatos que prestaram a prova desde a primeira fase, 11.820 obtiveram êxito em todas as etapas (além de provas objetivas, há provas discursivas) e vão receber a carteira de advogado, exigida de quem quer atuar como tal. Os dados estatísticos consolidados do resultado final desta edição do Exame de Ordem revelam o baixo índice de aprovação já era esperado, já que apenas 18% passaram na primeira fase. Quantos candidatos NÃO passaram na primeira fase (Índice de reprovação no 9º Exame de Ordem chega a quase 90%)? site http://ultimosegundo.ig.com.br/ na matéria de 22.03.2013 95.106 98.106 97.106 96.106 94.106 Gabarito Comentado. 4a Questão (Ref.: 201310736922) Variável Quantitativa é um tipo de dado que apresenta como realização quantidades, a característica é uma variável de tributo número. Qual das variáveis abaixo é um tipo de variável quantitativa contínua? Número de filhos Peso Número de disciplinas cursadas por um aluno Número de bactérias por litro de leite Número de acidentes em um mês Gabarito Comentado. 5a Questão (Ref.: 201310322977) Qual das variáveis abaixo é uma variável quantitativa discreta? Nível de açúcar no sangue Duração de uma chamada telefônica Altura Pressão arterial Número de faltas cometidas em uma partida de futebol Gabarito Comentado. 6a Questão (Ref.: 201310155812) A etimologia da palavra Estatística deriva do latim e significa: Estratificação Estratégia Estado Análise Dados Exercício: GST0308_EX_A2_201310134006 Voltar Aluno(a): ALINE ARAUJO KLIPPEL Matrícula: 201310134006 Data: 20/11/2014 20:33:52 (Finalizada) 1a Questão (Ref.: 201310724202) Se os dados são de natureza quantitativa discreta, as classes são os diferentes valores que surgem no conjunto dos dados. Na tabela de frequências para estes dados a informação é na coluna das frequências absolutas ¿ onde se registra o total de elementos da amostra que pertencem a cada classe. Em uma empresa foi realizada uma pesquisa a fim de saber a quantidade de filhos de cada funcionário com as opções de resposta 0 ¿ 1 ¿ 2 ¿ 3 e 4 filhos. Os dados da pesquisa foram organizados e a frequência absoluta correspondeu à seguinte: 30 - 36- 60 ¿ 24 - 10. Com base nos dados acima, construa a FREQUENCIA RELATIVA: 18,75% - 22,5% - 47,5% - 15% - 6,25%. 18,75% - 32,5% - 37,5% - 15% - 6,25%. 18,75% - 22,5% - 37,5% - 25% - 6,25%. 18,75% - 22,5% - 37,5% - 15% - 6,25%. 18,75% - 22,5% - 37,5% - 15% - 10,25%. 2a Questão (Ref.: 201310720118) Em uma pesquisa junto à consumidores sobre a marca de automóvel preferida, foram obtidas as seguintes respostas: FORD - 4 (EUA) FIAT - 3 (ITÁLIA) GM - 6 (EUA) NISSAN - 1 (JAPÃO) PEUGEOT - 3 (FRANÇA) RENAULT - 2 (FRANÇA) VOLKS - 5 (ALEMANHA) Podemos então afirmar que a frequência relativa dos entrevistados que preferem os veículos da NISSAN é de: 3,5% 10% 4,2% 8,3% 12,5% 3a Questão (Ref.: 201310724203) Se os dados são de natureza quantitativa discreta, as classes são os diferentes valores que surgem no conjunto dos dados. Na tabela de frequências para estes dados a informação é na coluna das frequências absolutas ¿ onde se registra o total de elementos da amostra que pertencem a cada classe. Em uma empresa foi realizada uma pesquisa a fim de saber a quantidade de filhos de cada funcionário com as opções de resposta 0 - 1 - 2 - 3 e 4 filhos. Os dados da pesquisa foram organizados e a frequência absoluta correspondeu à seguinte: 30 - 36- 60 - 24 - 10. Com base nos dados acima, construa a FREQUENCIA RELATIVA ACUMULADA: 18,75% - 51,25% - 78,75% - 93,75% - 100%. 18,75% - 51,25% - 88,75% - 93,75% - 100%. 18,75% - 41,25% - 88,75% - 93,75% - 100%. 18,75% - 41,25% - 78,75% - 93,75% - 100%. 18,75% - 41,25% - 68,75% - 83,75% - 100%. 4a Questão (Ref.: 201310722441) A distribuição de frequências é um agrupamento de dados em classes, de tal forma que contabilizamos o número de ocorrências em cada classe. O número de ocorrências de uma determinada classe recebe o nome de frequência absoluta. Considere a frequência absoluta das notas de 200 candidatos abaixo e obtenha a frequência relativa acumulada: 8-22-35-41-40-34-20. 4% - 15 % - 32,5% - 54% - 73% - 90% - 100%. 4% - 15 % - 33% - 53 % - 73% - 90% - 100%. 4% - 15 % - 33,5% - 53 % - 73% - 90% - 100%. 4% - 15 % - 32,5% - 53 % - 74% - 90% - 100%. 4% - 15 % - 32,5% - 53 % - 73% - 90% - 100%. 5a Questão (Ref.: 201310375530) São aqueles valores a que se chegou pela simples coleta, sem qualquer Preocupação quanto à sua ordenação. Dados Brutos Amplitude Limite ROL Frequencia Gabarito Comentado. 6a Questão (Ref.: 201310724188) A Estatística é uma ferramenta matemática muito utilizada em vários setores da sociedade, organizando dados de pesquisas e apresentando informações claras e objetivas. Considere a seguinte situação: Às pessoas presentes em um evento automobilístico foi feita a seguinte pergunta: Qual a sua marca de carro preferida? Asmarcas eram A, B, C, D, E, F, G e a frequência absoluta correspondeu à seguinte: 4-3-6-1-3-2-5. Com base nos dados acima, construa a FREQUENCIA ABSOLUTA ACUMULADA: 4-7-13-14-17-19-24 4-7-14-15-17-19-24 4-8-13-14-17-19-24 4-7-13-15-16-19-24 4-7-13-14-17-20-24 1a Questão (Ref.: 201402423199) A estatística é uma ciência que se dedica_______________________. Preocupa-se com os métodos de recolha, organização, resumo, apresentação e interpretação dos dados, assim como tirar conclusões sobre as características das fontes donde estes foram retirados, para melhor compreender as situações à coleta e análise de dados à coleta e interpretação de dados à interpretação de dados à coleta, análise e interpretação de dados à análise e interpretação de dados Gabarito Comentado. 2a Questão (Ref.: 201402370654) Qual das variáveis abaixo é uma variável qualitativa nominal? Cargo na empresa Classificação de um filme Classe social Cor da pele Nível socioeconômico 3a Questão (Ref.: 201402424019) De acordo com um conjunto de elementos, é retirado uma parte dele para a inferência Estatística. Logo, podemos classificar esta parte como: Amostra, que é um subconjunto finito, uma parte selecionada das observações abrangidas pela população. Moda, porque a moda sempre será igual a amostra. Desvio Padrão pois é sempre uma parte significativa deste conjunto de elementos. Média dos elementos destes conjuntos. Mediana, pois a mesma divide em duas partes iguais. Gabarito Comentado. 4a Questão (Ref.: 201402203488) A etimologia da palavra Estatística deriva do latim e significa: Estado Estratégia Estratificação Dados Análise Gabarito Comentado. 5a Questão (Ref.: 201402370653) Qual das variáveis abaixo é uma variável quantitativa discreta? Número de faltas cometidas em uma partida de futebol Nível de açúcar no sangue Altura Pressão arterial Duração de uma chamada telefônica Gabarito Comentado. 6a Questão (Ref.: 201402208603) Uma característica que pode assumir diferentes valores de indivíduo para indivíduo é denominada variável. As variáveis podem ser classificadas por: Constantes e sistemáticas Qualitativas e modais. Medianas e qualitativas. Quantitativas e numéricas. Quantitativas e qualitativas. 1a Questão (Ref.: 201402265198) São características de uma variável categorizada (qualitativa) nominal: os dados são mutuamente excludentes e tem ordenação natural. os dados só serão apresentados em valores qualquer intervalo, mutuamente inclusivas. os dados são distribuídos em categorias mutuamente exclusivas, sem indicação de ordem. os dados podem assumir quaisquer valores num dado intervalo, como o tempo de espera. os dados só podem assumir valores em determinado intervalo, como o número de moedas no bolso. 2a Questão (Ref.: 201402771878) Se os dados são de natureza quantitativa discreta, as classes são os diferentes valores que surgem no conjunto dos dados. Na tabela de frequências para estes dados a informação é na coluna das frequências absolutas ¿ onde se registra o total de elementos da amostra que pertencem a cada classe. Em uma empresa foi realizada uma pesquisa a fim de saber a quantidade de filhos de cada funcionário com as opções de resposta 0 ¿ 1 ¿ 2 ¿ 3 e 4 filhos. Os dados da pesquisa foram organizados e a frequência absoluta correspondeu à seguinte: 30 - 36- 60 ¿ 24 - 10. Com base nos dados acima, construa a FREQUENCIA RELATIVA: 18,75% - 22,5% - 37,5% - 25% - 6,25%. 18,75% - 22,5% - 47,5% - 15% - 6,25%. 18,75% - 22,5% - 37,5% - 15% - 10,25%. 18,75% - 32,5% - 37,5% - 15% - 6,25%. 18,75% - 22,5% - 37,5% - 15% - 6,25%. 3a Questão (Ref.: 201402771864) A Estatística é uma ferramenta matemática muito utilizada em vários setores da sociedade, organizando dados de pesquisas e apresentando informações claras e objetivas. Considere a seguinte situação: Às pessoas presentes em um evento automobilístico foi feita a seguinte pergunta: Qual a sua marca de carro preferida? As marcas eram A, B, C, D, E, F, G e a frequência absoluta correspondeu à seguinte: 4-3-6-1-3-2-5. Com base nos dados acima, construa a FREQUENCIA ABSOLUTA ACUMULADA: 4-7-14-15-17-19-24 4-7-13-15-16-19-24 4-7-13-14-17-19-24 4-7-13-14-17-20-24 4-8-13-14-17-19-24 4a Questão (Ref.: 201402773708) É correto afirmar com base nos pesos de 20 alunos de uma universidade (1kg de precisão): 20% com mais de 73 kg. 80% com menos de 74 kg. 60% com mais de 63 kg. 70% com menos de 64 kg. 20% com mais de 68 kg. Gabarito Comentado. 5a Questão (Ref.: 201402265199) É característica de uma fonte primária de dados: o fato dos dados serem obtidos por meio dos jornais especializados, com informações como o comportamento do preço das ações. o fato dos dados serem organizados através de estudos baseados em observações feitas por terceiros. o fato do pesquisador ser o primeiro a fazer a análise dos dados coletados por alguma organização. o fato do pesquisador ser, ele próprio, quem faz a coleta de dados para fins de análise estatística. nenhuma das alternativas acima. 6a Questão (Ref.: 201402773706) Mediu-se a altura de 100 estudantes da Universidade XYZ: Com base no resultado obtido, pode-se afirmar que: A frequência dos alunos que medem menos de 1,77 m é de 92%. A frequência dos alunos que medem mais de 1,82 m é de 100%. A frequência relativa dos alunos que medem entre 1,59 m e 1,64 mé de 23%. A frequência de alunos com mais de 1,70m é de 65%. A frequência acumulada dos alunos que medem até 1,64 m é de 18%. 1a Questão (Ref.: 201402370663) Os números a seguir representam o Índice Nacional de Preços ao Consumidor Amplo (IPCA), no período compreendido entre fevereiro a junho de 2012. Qual é a média da inflação nesse período? fev-12: 0,45% / mar-12: 0,21% / abr-12: 0,64% / mai-12: 0,36% / jun-12: 0,08% 0,43% 0,35% 0,39% 0,37% 0,41% Gabarito Comentado. 2a Questão (Ref.: 201402424708) O valor que divide a distribuição em duas partes iguais é conhecido como Média Amplitude total Moda Mediana Amplitude Gabarito Comentado. 3a Questão (Ref.: 201402371574) O cálculo da média, mediana e moda do conjunto de dados: 33 / 25 / 42 / 29 / 37 / 21 / 27 / 31 / 25, evidencia que: média = mediana moda > média mediana = moda mediana < moda média > mediana Gabarito Comentado. 4a Questão (Ref.: 201402770336) Uma pesquisa para determinar a eficiência de uma nova ração para animais, em termos de ganho de peso, mostrou que após um mês em que a ração normal foi substituída pela ração nova. o animais apresentam um aumento de peso segundo a tabela: Aumento de peso em Kg ( classe ) 0 I- 1 I- 2 I- 3 I- 4 I- 5 e o número de animais ( fi ) respectivamente foi 1; 5; 35; 37; 28 . Calcule aumento médio do peso por
Compartilhar