A alternativa correta é "Apenas (1) e (2)". A afirmação 1 está correta, pois outliers são dados que fogem do padrão dos demais e precisam ser identificados e analisados. A afirmação 2 também está correta, pois outliers podem ser produzidos por erros de medição, valores default assumidos durante o preenchimento de uma base de dados ou podem corresponder a valores corretos mas pertencentes a uma base de dados desbalanceada. Já a afirmação 3 está incorreta, pois a eliminação de outliers não é a única opção. É possível utilizar técnicas de tratamento de dados para corrigir ou suavizar esses valores, ou até mesmo utilizá-los em análises específicas. Por fim, a afirmação 4 está correta, pois a detecção de outliers pode ser feita por meio de técnicas univariadas, que exploram cada atributo e variabilidade dos valores em torno da média. Quando a variabilidade é grande, pode indicar registros potenciais outliers.
Para escrever sua resposta aqui, entre ou crie uma conta
Compartilhar