Baixe o app para aproveitar ainda mais
Prévia do material em texto
1 EST-10030 – Análise Estatística (Computação em Estatística) 2a. VAE – 07/12/2013 Prof. Maria Deolinda Borges Cabral Esta prova pode ser feita com consulta aos seus próprios materiais. Não é permitida consulta aos colegas, nem uso de qualquer dispositivo de rede ou de comunicação durante a prova. Ao final, você deverá entregar os resultados em dois arquivos: a) um arquivo com todos os comandos SAS que escreveu e executou para obter seus resultados; dê a este arquivo seu nome e a extensão .sas (exemplo: Maria.sas); b) um relatório salvo em PDF com os resultados das análises que você produziu para responder às questões; dê a este arquivo o seu nome; c) nos dois arquivos, identifique a resolução com as questões e itens correspondentes – exemplo Questão 2c, etc. 1ª Questão) Os dados abaixo referem-se a meses de experiências de 10 funcionários de uma dada fábrica de montagem e o número de erros cometidos na sequência de montagem das peças. O objetivo é avaliar se conforme o tempo de experiência aumenta o número de erros decai. A partir dessa tabela, resolva as seguintes tarefas: a) [0,5 pontos] Crie um arquivo SAS denominado ARQ1 e construa um gráfico de dispersão bidimensional do erros versus meses para essa amostra. Existe evidência de uma relação linear entre essas duas variáveis? E outliers? Caso exista, identifique a observação. Meses Erros 1 30 2 28 3 24 4 20 6 5 7 14 8 13 9 10 10 7 11 6 2 b) [0,5 pontos] Caso o gráfico em a) sugira, ajuste um modelo de regressão linear aos dados e identifique as estimativas dos parâmetros do modelo e seus erros padrões, e também o coeficiente de explicação; c) [1,0 ponto] Caso o gráfico em a) tenha apontado valores outliers, construa um novo gráfico de dispersão bidimensional do Y versus X, excluindo os valores outliers, e construa um novo modelo de regressão linear aos dados e apresente as novas estimativas dos parâmetros do modelo e seus erros padrão, e também o coeficiente de explicação. d) [0,5 ponto] Compare os dois modelos (com e sem os outliers) e escolha um dos modelos. Justifique a sua escolha. e) [0,5 ponto] Considerando o modelo escolhido, apresente o IC (α=0.05) para β e calcule o número médio esperado de erros para um funcionário com 5 meses de experiência e determine o seu intervalo de confiança. 2ª Questão) Considere os dados do arquivo MERCAD. Use comandos da PROC SQL para responder as seguintes perguntas. a) [1,5 ponto] Calcule a variável CUSTO_TOTAL dada pela multiplicação do número de unidades pelo custo de cada item. Calcule o custo médio total (CUSTO_MEDIO_TOTAL). Transforme a variável ITEM da seguinte maneira: ITEM=’1’ � ITEM2=’Borracha’. ITEM=’2’ � ITEM2=’Caneta’. ITEM=’3’ � ITEM2=’Lapis’; ITEM=’4’ � ITEM2=‘Lapiseira’. ITEM=’5’ � ITEM2=’Marcador’. Crie uma variável denominada NUM_OBS que forneça o número do registro dentro do arquivo. Grave um arquivo denominado ARQA com a variáveis originais do arquivo lido, eliminando a variável ITEM e acrescentando as variáveis criadas ITEM2, CUSTO_TOTAL, CUSTO_MEDIO_TOTAL e NUM_OBS; Prepare uma listagem com as três primeiras observações do arquivo ARQA, com as variáveis na seguinte ordem: NUM_OBS, ANO, REGIAO, ITEM2, CUSTO, UNIDADES, CUSTO_TOTAL, CUSTO_MEDIO_GERAL, com o seguinte título: ‘EXEMPLO DO ARQUIVO DE MERCADORIAS’. Colar no relatório; 3 b) [1,0 pontos] A partir do arquivo ARQA, prepare uma listagem com o custo médio geral e o custo médio por ano e região, excluindo os registros com item=‘Marcador’. Crie um título. Nessa listagem devem estar os valores dos custos solicitados, para cada cruzamento de ANO e REGIAO. Cole no relatório e comente os resultados. c) [1,5 ponto] A partir do arquivo ARQA, imprima as regiões que apresentam CUSTO_MEDIO_REGIAO 10% acima do CUSTO_MEDIO_GERAL. Imprima o nome da região e os valores dos custos comparados. Comente os resultados. 3ª Questão) Vamos analisar os valores da variável NOTA (nota do aluno) registrados no arquivo denominado ESCOLA_NOTAS utilizando a PROC IML do SAS. O objetivo é destacar as piores e melhores notas obtidas. Para a solução desse exercício resolvam as seguintes etapas: a) [0,25 pontos] Leia as variáveis do arquivo NOTAS na PROC IML, e armazene em uma matriz denominada DADOS; b) [0,5 pontos] Calcule os valores do primeiro e terceiro quartil (Q1 e Q3, respectivamente) da variável NOTA. Imprima os valores de Q1 e Q3. Sugestão: utilizem a função QNTL para resolver essa questão; c) [0,5 pontos] Crie vetores CERCA1 e CERCA2 com os valores repetidos de Q1 e Q3, respectivamente, com um total de linhas igual ao número de linhas da matriz DADOS; d) [0,25 pontos] Acrescente esses dois vetores à matriz DADOS. Imprima a matriz DADOS. e) [0,25 pontos] Crie o vetor coluna DEST, com o número de linhas da matriz dados, atribuindo o valor 0 (zero) em todas as linhas; f) [0,5 pontos] Acrescente a coluna DEST à matriz DADOS. Use os comandos DO e IF para trocar o valor do vetor DEST para -1 quando o valor da NOTA for menor do que Q1 e para 1 quando o valor for maior do que Q3. g) [0,25 ponto] Acrescente o nome das variáveis à matriz DADOS e imprima essa matriz. Sugestão: usar os nomes OBS, QUANT, Q1, Q3 e DEST. h) [0,50 ponto] Grave a matriz DADOS em um arquivo SAS denominado ESCOLA_NOTAS2.
Compartilhar