Buscar

Análise Estatística - SAS (Computação em Estatística) Prova 2 - (Prof. Deolinda)

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 3 páginas

Prévia do material em texto

1 
EST-10030 – Análise Estatística (Computação em Estatística) 
2a. VAE – 07/12/2013 
 
Prof. Maria Deolinda Borges Cabral 
 
Esta prova pode ser feita com consulta aos seus próprios materiais. Não é permitida consulta 
aos colegas, nem uso de qualquer dispositivo de rede ou de comunicação durante a prova. 
 
Ao final, você deverá entregar os resultados em dois arquivos: 
a) um arquivo com todos os comandos SAS que escreveu e executou para obter seus 
resultados; dê a este arquivo seu nome e a extensão .sas (exemplo: Maria.sas); 
b) um relatório salvo em PDF com os resultados das análises que você produziu para 
responder às questões; dê a este arquivo o seu nome; 
c) nos dois arquivos, identifique a resolução com as questões e itens correspondentes – 
exemplo Questão 2c, etc. 
 
1ª Questão) Os dados abaixo referem-se a meses de experiências de 10 funcionários de uma 
dada fábrica de montagem e o número de erros cometidos na sequência de montagem das 
peças. O objetivo é avaliar se conforme o tempo de experiência aumenta o número de erros 
decai. 
 
 
 
 
 
 
 
A partir dessa tabela, resolva as seguintes tarefas: 
a) [0,5 pontos] Crie um arquivo SAS denominado ARQ1 e construa um gráfico de 
dispersão bidimensional do erros versus meses para essa amostra. Existe evidência de 
uma relação linear entre essas duas variáveis? E outliers? Caso exista, identifique a 
observação. 
Meses Erros 
1 30 
2 28 
3 24 
4 20 
6 5 
7 14 
8 13 
9 10 
10 7 
11 6 
 2 
b) [0,5 pontos] Caso o gráfico em a) sugira, ajuste um modelo de regressão linear aos 
dados e identifique as estimativas dos parâmetros do modelo e seus erros padrões, e 
também o coeficiente de explicação; 
c) [1,0 ponto] Caso o gráfico em a) tenha apontado valores outliers, construa um novo 
gráfico de dispersão bidimensional do Y versus X, excluindo os valores outliers, e 
construa um novo modelo de regressão linear aos dados e apresente as novas 
estimativas dos parâmetros do modelo e seus erros padrão, e também o coeficiente de 
explicação. 
d) [0,5 ponto] Compare os dois modelos (com e sem os outliers) e escolha um dos 
modelos. Justifique a sua escolha. 
e) [0,5 ponto] Considerando o modelo escolhido, apresente o IC (α=0.05) para β e calcule 
o número médio esperado de erros para um funcionário com 5 meses de experiência e 
determine o seu intervalo de confiança. 
 
2ª Questão) Considere os dados do arquivo MERCAD. Use comandos da PROC 
SQL para responder as seguintes perguntas. 
a) [1,5 ponto] Calcule a variável CUSTO_TOTAL dada pela multiplicação do número 
de unidades pelo custo de cada item. Calcule o custo médio total 
(CUSTO_MEDIO_TOTAL). Transforme a variável ITEM da seguinte maneira: 
ITEM=’1’ � ITEM2=’Borracha’. 
ITEM=’2’ � ITEM2=’Caneta’. 
ITEM=’3’ � ITEM2=’Lapis’; 
ITEM=’4’ � ITEM2=‘Lapiseira’. 
ITEM=’5’ � ITEM2=’Marcador’. 
 
Crie uma variável denominada NUM_OBS que forneça o número do registro dentro 
do arquivo. Grave um arquivo denominado ARQA com a variáveis originais do 
arquivo lido, eliminando a variável ITEM e acrescentando as variáveis criadas 
ITEM2, CUSTO_TOTAL, CUSTO_MEDIO_TOTAL e NUM_OBS; 
Prepare uma listagem com as três primeiras observações do arquivo ARQA, com as 
variáveis na seguinte ordem: NUM_OBS, ANO, REGIAO, ITEM2, CUSTO, 
UNIDADES, CUSTO_TOTAL, CUSTO_MEDIO_GERAL, com o seguinte título: 
‘EXEMPLO DO ARQUIVO DE MERCADORIAS’. Colar no relatório; 
 
 3 
b) [1,0 pontos] A partir do arquivo ARQA, prepare uma listagem com o custo médio 
geral e o custo médio por ano e região, excluindo os registros com item=‘Marcador’. 
Crie um título. Nessa listagem devem estar os valores dos custos solicitados, para 
cada cruzamento de ANO e REGIAO. Cole no relatório e comente os resultados. 
c) [1,5 ponto] A partir do arquivo ARQA, imprima as regiões que apresentam 
CUSTO_MEDIO_REGIAO 10% acima do CUSTO_MEDIO_GERAL. Imprima o 
nome da região e os valores dos custos comparados. Comente os resultados. 
 
3ª Questão) Vamos analisar os valores da variável NOTA (nota do aluno) registrados no 
arquivo denominado ESCOLA_NOTAS utilizando a PROC IML do SAS. O objetivo é 
destacar as piores e melhores notas obtidas. 
 
Para a solução desse exercício resolvam as seguintes etapas: 
 
a) [0,25 pontos] Leia as variáveis do arquivo NOTAS na PROC IML, e armazene em 
uma matriz denominada DADOS; 
b) [0,5 pontos] Calcule os valores do primeiro e terceiro quartil (Q1 e Q3, 
respectivamente) da variável NOTA. Imprima os valores de Q1 e Q3. Sugestão: utilizem a 
função QNTL para resolver essa questão; 
c) [0,5 pontos] Crie vetores CERCA1 e CERCA2 com os valores repetidos de Q1 e Q3, 
respectivamente, com um total de linhas igual ao número de linhas da matriz DADOS; 
d) [0,25 pontos] Acrescente esses dois vetores à matriz DADOS. Imprima a matriz 
DADOS. 
e) [0,25 pontos] Crie o vetor coluna DEST, com o número de linhas da matriz dados, 
atribuindo o valor 0 (zero) em todas as linhas; 
f) [0,5 pontos] Acrescente a coluna DEST à matriz DADOS. Use os comandos DO e IF 
para trocar o valor do vetor DEST para -1 quando o valor da NOTA for menor do 
que Q1 e para 1 quando o valor for maior do que Q3. 
g) [0,25 ponto] Acrescente o nome das variáveis à matriz DADOS e imprima essa 
matriz. Sugestão: usar os nomes OBS, QUANT, Q1, Q3 e DEST. 
h) [0,50 ponto] Grave a matriz DADOS em um arquivo SAS denominado 
ESCOLA_NOTAS2.

Outros materiais