Buscar

Análise Discriminante e Extração de Fatores Latentes Para Previsão de Alunos Bons na Disciplina de Estrutura de Dados

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes
Você viu 3, do total de 5 páginas

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Análise Discriminante e Extração de Fatores Latentes Para 
Previsão de Alunos Bons na Disciplina de Estrutura de Dados 
Crislânio de Souza Macêdo, David Oliveira Silva, Críston Pereira Souza, Lucas 
Ismaily Bezerra Freitas, 
Curso de Bacharelado em Ciência da Computação – Universidade Federal do Ceará 
(UFC) – Campus Quixadá 
Caixa Postal 15.064 – 91.501-970 – Ceará – CE – Brasil 
 crislanio.ufc@gmail.com, davidoliveirasilva@hotmail.com 
criston@ufc.com, ismailybf@ufc.br
Abstract. The aim of this study is identify the profiles of good students in data 
structure (ED) on UFC Campus Quixadá. In order to do it, we use data’s with 
students of UFC in Quixadá(UFC-Quixadá). The study takes place through the 
statistical techniques: Factor Analysis and Analyze Discriminant() . 
Resumo. O objetivo deste estudo é identificar os perfis de alunos bons em 
estrutura de dados (ED) na UFC em Quixadá. Para isso foi utilizado uma 
base de dados com alunos do Campus da UFC em Quixadá (UFC-Quixadá). 
O estudo se dá através das técnicas estatísticas: Análise Fatorial (AF) e 
Análise Discriminante (AD). 
1. Introdução 
 Este trabalho segue a metodologia do livro Análise multivariada: para cursos de 
administração [DIAS FILHO, J.M,; CORRAR, L.J (2009)], ciências contábeis e economia, 
não apresentamos detalhadamente a metodologia por falta de espaço. Nosso objetivo é 
identificar fatores que diferenciem bons alunos em ED. Para este estudo, um aluno 
aprovado na primeira vez que cursou a disciplina é considerado bom aluno, com base 
nas disciplinas de matemática básica (BÁSICA), matemática discreta (DISCRETA), 
fundamentos de programação (FUP). 
2. Metodologia 
 Foi utilizado uma base de dados dos alunos do Campus da UFC em Quixadá na qual 
foi analisado (754 dados de entrada). Em seguida, utilizamos a ferramenta Statistical 
Package for the Social Sciences (SPSS) da IBM [SPSS, 2015] para realizar as análises 
estatísticas nos dados, a saber: Análise Fatorial (AF) e Análise Discriminante (AD). 
3. Análise Multivariada de Dados 
A Análise Multivariada de Dados refere-se a um conjunto de métodos estatísticos que 
torna possível a análise simultânea de medidas múltiplas para cada indivíduo, objeto ou 
fenômeno observado [DIAS FILHO, J.M,; CORRAR, L.J, 2009]. Para nossa análise 
utilizaremos duas técnicas descritas brevemente a seguir. 
 
 
3.1. Análise Discriminante (AD) 
 A AD é uma técnica estatística que auxilia a identificar as variáveis que 
diferenciam os grupos e quantas dessas variáveis são necessárias para obter a melhor 
classificação dos indivíduos de uma determinada população. Com a AD podemos 
identificar relações entre a variável dependente e independentes e variáveis que melhor 
discriminam depois formar grupos. 
3.2. Análise Fatorial (AF) 
 A AF é uma técnica estatística que estuda os inter-relacionamentos entre as 
variáveis, em um esforço para encontrar um conjunto de fatores (em menor número que 
o conjunto de variáveis originais) que exprima o que as variáveis originais partilham em 
comum. A AF nos permite identificar relações entre as variáveis estudadas gerando 
fatores na qual será utilizado na AD. 
4. Análise dos Dados 
 Na Figura 1 temos a estatística descritivas da amostra. 
 
Figura 1.Estatística Descritiva da Amostra 
Fonte: O autor, 2015 
 
Figura 2.Gráfico Scatter para fatores de mais variância 
Fonte: O autor, 2015 
5. Resultados obtidos 
Na AF cada variável é explicada considerando todas as outras, incluindo-se as 
variáveis latentes. Na Figura 3, vemos que o grau de explicação atingido por 3 fatores é 
de 72,294 %, ou seja, o modelo consegue explicar aproximadamente 73% da variância 
dos dados originais. Foi utilizado como método de extração a análise de componentes 
principais. 
 
 
 
Figura 3.Total de Variância Explicada 
Fonte: O autor, 2015 
 A Figura| 4 mostra os fatores após a rotação Varimax (Rotated Component 
Matrix), onde é possível fazer uma classificação mais precisa dos indicadores em cada 
um dos fatores. Os Fatores formados foram: Fator 1 (“Aluno bom em BÁSICA, 
DISCRETA, FUP”) composto por fup_media_medias, basica_media_medias, 
discreta_media_medias; o Fator 2 (“Aluno Ruim em DISCRETA”) composto por 
discreta_media_faltas, discreta_n_rep_tranc e o Fator 3 (“Aluno que falta muito em 
FUP, BÁSICA, e que reprova ou tranca BÁSICA”) composto por fup_media_faltas, 
basica_media_faltas, basica_n_rep_tranc; 
 
Figura 4.Matriz dos Componentes Rotacionada 
Fonte: O autor, 2015 
 Extraídos os fatores latentes foi feito uma AD. Em ED tivemos 655 alunos 
classificados com 1(bons) e 99 alunos com 0, assim que escolhemos um total de 198 
casos aleatórias, 99 alunos com 0, e 99 alunos com 1 para fazer a AD. 
 
 
Figura 5.Tabelas de Frequências para Bons Alunos 
Fonte: O autor, 2015 
 
Figura 6.Estatística U 
 
 
Fonte: O autor, 2015 
 Na Estatística U, vemos que o Fator 1 tem o melhor poder de discriminação, em 
função do baixo valor da estatística de Wilks’ Lambda (quanto menor o valor e mais 
próximo de zero melhor). No teste F-Anova o Fator 1 tem nível de significância <0,05 
(indica diferença significante entre as médias do grupo), esse teste auxilia o teste 
anterior e confirma que de fato o Fator 1 é o que tem o melhor poder discriminante. 
 No teste de multicolinearidade, o Fator 1 contribuiu para a formação de uma 
função discriminante. 
 
Figura 7.Função Discriminante 
Fonte: O autor, 2015 
 Com base nos coeficientes não padronizados acima, a função discriminante (Escore Z) 
é: 
Z= 0,000 + 1,099(Fator 1) +0,417(Fator 2). 
 
Figura 8.Centroides 
Fonte: O autor, 2015 
 Os centroides dos grupos 0 e 1 são respectivamente 0,620 e -0,620. Calculando 
tem-se Z’ = [99 (0,620) + 99(-0,620) / 198] = 0. Então, se utilizássemos os dados 
coletados da primeira amostra e substituíssemos na função discriminante, 
encontraríamos Escore Z no valor de: Z= 0,000+1,099 (99) + 0,417 (99) = 150,084. 
Como esse valor é maior que o Z crítico, classificamos essa observação no grupo 1. Tal 
classificação pela AD está correta quando observamos a classificação original, conforme 
ilustrado na Figura 10. 
 
 
Figura 9.Capacidade Preditiva do Modelo 
Fonte: O autor, 2015 
 
 
Com a análise dos coeficientes na Figura 9, alunos com os coeficientes mais altos no 
fator 1 e menor coeficiente no fator 2 serão classificados como bons alunos em ED. 
 
 
Figura 10.Classificação Final 
Fonte: O autor, 2015 
 Utilizando a função discriminante, há 78 classificações corretas no grupo 0, e 68 
no grupo 1. Portanto 73, 7% dos casos seriam classificados corretamente nos grupos 
originais pela AD. Na Validação Cruzada, 77, 8 % dos casos seriam classificados 
corretamente no grupo 0 e 68, 7% no grupo 1. 
 
Figura 11.Função Discriminante para os grupos 0 e 1 
Fonte: O autor, 2015 
Exibimos na Figura 11 uma discriminação dos grupos de alunos bons ruins. 
6. Conclusão 
 Em síntese este trabalho traz um estudo sobre os perfis de alunos bons em ED no 
Campus da UFC Quixadá. Foi possível observar que o Fator 1 foi mais importante para 
determinar se o aluno terá bom desempenho em Estrutura de Dados. 
Referências 
DIAS FILHO, J.M.; CORRAR, L.J. Regressão Logística. In: CORRAR, L.J.; PAULO, 
E.; DIAS FILHO, J.M. (Coord.). Análise multivariada: para cursos de administração, 
ciências contábeis e economia. FIPECAFI – Fundação Instituto de Pesquisas 
Contábeis, Atuariais e Financeiras; São Paulo: Atlas, 2009 
COHEN, Jacob. (1988), Statistical power analysis for the behavioral sciences. Hillsdale, 
NJ, Erlbaum. 
Statistical Package for the Social Sciences (SPSS, 2015). Disponível:http://www-01.ibm.com/software/br/analytics/spss/. Acesso em Novembro de 2015.

Outros materiais