Buscar

CONTABILOMETRIA resumo

Prévia do material em texto

CONTABILOMETRIA
ESTATÍSTICA DESCRITIVA: (comando: tabstat) importante pois permite uma melhor compreensão do comportamento dos dados, identificando tendências, variabilidade e valores atípicos.
N = número de observações; mean = média; p50 = mediana; sd = desvio padrão; min e máx = ajuda a verificar se há outliers.
Média maior que a mediana: valores muito altos em relação aos demais.
IDENTIFICANDO OUTLIERS: gráfico box-plot ajuda a identificar visualmente os outliers, mas para comprovar é preciso fazer testes, como o hadi.
O “hadimvo” elimina outliers e é importante retirá-los para não prejudicar a análise.
HISTOGRAMA: é muito útil para representar visualmente como os valores se espalham ou se distribuem em torno da média. A normal é a “curva” e ela deve ser tipo um morrinho no centro, e as barras devem se aproximar dela.
CORRELAÇÃO DAS VARIÁVEIS: (comando pwcorr) A premissa é que não pode existir alta correlação entre as variáveis explicativa (multicolinearidade), pois se houver uma correlação muito alta pode indicar que uma variável é dependente da outra, e não é recomendado que as duas expliquem uma terceira variável. O ideal para não ser considerado uma alta correlação é uma porcentagem menor que 70%. (No nosso trabalho, as explicativas eram PL e RL).
REGRESSÃO: comando reg.
- Teste F: mede a significância do modelo como um todo. A sua hipótese nula é (H 0: nenhum parâmetro é significativo). Para o modelo ser considerado bom o teste deve rejeitar H0, ou seja, (Prob > F) deve ser menor que 5%. E sendo assim, pelo menos um parâmetro é significativo.
- R²: indica o quanto da variação de Y é explicada pela variação de X. Nesse caso R²=0.4696, ou seja, apenas 46,96% da variação de valor de mercado é explicado pela variação de receita líquida e patrimônio líquido, indicando pouco capacidade explicativa, porém, na nossa área isso não é muito significativo, pois é comum R² de baixos valores.
- Test T (teste da significância das variáveis): mede a significância de cada parâmetro. Se P >| t | for menor que 5% indica que existe pelo menos um parâmetro diferente de zero e, portanto, é significativo.
- Intervalo de confiança: é o intervalo que o beta pode variar, mostrando o ponto mínimo e o ponto máximo, já o coef, indica o valor médio do beta.
GRÁFICO DE RESÍDUOS: (cheio de pontinhos) Com o gráfico dos resíduos é possível verificar como os resíduos estão distribuídos. O ideal é que os resíduos estejam espalhados homogeneamente dentro do plano cartesiano no gráfico.
Quando os resíduos não estão totalmente espalhados homogeneamente, pode haver problema na forma funcional. 
Para homogeneizar os resíduos: LOG nas variáveis Y e X.
ROOT MSE: (na regressão) importante que não dê muito alto – o porquê só o todo poderoso Deus sabe.
HETEROCEDASTICIDADE: problema disso ocorro quando a variância do termo de erro não é constante. A hipótese nula é H0 = as variâncias dos erros são homogêneas, nesse caso o ideal é não rejeitar H0, e, portanto, prob > chi2 deve ser maior que 5%. Para isso roda-se o teste de Breusch- Pagan (estat httest).
MULTICOLINEARIDADE: As variáveis podem apresentar comportamentos semelhantes, ou seja, pode existir uma alta correlação entre elas. A multicolinearidade deve ser verificada, pois pode afetar o beta. Uma das formas muito utilizada para verificar a multicolinearidade em modelos de regressão, é por meio das estatísticas VIF (Variance Inflation Factor). Se obter VIF acima de 10, indica que existe graves problemas de multicolinearidade, sendo inaceitável. O indicado é um valor abaixo de 5, pois acima desse valor já pode ter problemas. (COMANDO: estat vif).
VARIÁVEL OMITIDA: Variável omitida é a variável não avaliada, por desconhecimento ou falta de condições de melhorar o modelo. São variáveis aleatórias e seus efeitos estão indicados como o termo de erro. Para verificar a sua existência foi utilizado o “estat ovtest”. A hipótese nula é que não tem variável omitida no teste e isso é bom, ou seja, prob > F deve ser menor que 5%. Se for menor que 5%, indica problemas na forma funcional.

Continue navegando