Prévia do material em texto
Técnicas de Modelagem para Estudos Ambientais 1° módulo - Estatística básica 2 1° módulo – Estatística básica Aula 01 – Tipos de variáveis, apresentação de dados em tabelas, frequência Aula 02 – Apresentação de dados em gráficos, medidas de tendência central Aula 03 – A questão da variabilidade, boxplot Aula 04 – Relação entre duas variáveis Aula 05 – Probabilidade, população e amostra Referência: Estatística básica; Vieira,Sonia. CENGAGE Learning, 2012. 3 Aula 04 – Relação entre duas variáveis Muitas vezes buscamos padrões de comportamento entre variáveis, ou ainda temos a sensação de uma relação entre elas, que pode não ser específica de um par de medidas, mas se estabelece na média dos padrões das variáveis Podemos investigar essa relação de diferentes formas: – Graficamente – Com cálculos estatísticos 4 Aula 04 – Relação entre duas variáveis Gráfico de dispersão - Cada ponto representado no plano cartesiano relaciona um dado da variável X comum dado da variável Y • Costumamos identificar uma variável como independente (X) e a outra como dependente (Y) • A variável independente é representada no eixo das abcissas (X) e a dependente no eixo das ordenadas (Y) • Temos como resultado uma “nuvem de pontos” e procuramos por um padrão nessa nuvem 5 Aula 04 – Relação entre duas variáveis Nuvem de pontos - Se a nuvem de pontos parece se orientar de forma crescente, ou seja, o valor de Y aumenta das esquerda para a direita, vemos que Y cresce quando X cresce e, portanto, temos uma relação positiva ou direta - Se a nuvem de pontos parece se orientar de forma decrescente, ou seja, o valor de Y diminui das esquerda para a direita, vemos que Y decresce quando X cresce e, portanto, temos uma relação negativa ou inversa 6 Aula 04 – Relação entre duas variáveis Intensidade da relação - Quanto mais dispersos estão os pontos em relação ao padrão crescente ou decrescente, menor a correlação - A dispersão pode ser entendida no gráfico como a “clareza” do padrão formado da relação entre as variáveis - Correlação nula: quando não se observa padrão 7 Aula 04 – Relação entre duas variáveis Coeficiente de correlação linear (de Pearson - r) - É um coeficiente que indica a intensidade de correlação entre as duas variáveis - Ele é calculado com a covariância e os desvios padrões de ambas as variáveis 8 Aula 04 – Relação entre duas variáveis Coeficiente de correlação linear (de Pearson - r) - varia entre -1 e 1 - valores negativos indicam correlação linear inversa - |r| = 0; correlação nula - |r| < 0,25; correlação pequena - 0,25 < |r| < 0,5; correlação fraca - 0,5 < |r| < 0,75; correlação moderada - |r| > 0,75; correlação forte - |r| = 1; correlação perfeita 9 Aula 04 – Relação entre duas variáveis Coeficiente de correlação linear (de Pearson - r) - Não comprova causalidade!!! - Correlação espúria = sem causalidade 10 Aula 04 – Relação entre duas variáveis Correlações não lineares - correlação linear: reta (calculamos r) - padrão não indica uma reta: podemos observar outros tipos de curvas 11 Aula 04 – Relação entre duas variáveis Séries temporais - sequência de dados obtidos e monitorados ao longo do tempo 12 Aula 04 – Relação entre duas variáveis Extrapolação - deve ser feita com cuidado - linha de tendência em séries temporais - regressão linear simples 13 Aula 04 – Relação entre duas variáveis Ajuste de curvas - relações determinísticas x relações probabilísticas - “Regressão ou ajuste de curvas é um recurso formal para expressar alguma tendência da variável dependente y quando relacionada com a variável independente x. Em outras palavras, regressão é um mecanismo ou artifício que fornece uma relação funcional quando se tem uma relação estatística.” (Bassanezi, 2004. Bassanezi, R.C. Ensino-aprendizagem com modelagem matemática. São Paulo : Contexto, 2004) 14 Aula 04 – Relação entre duas variáveis Regressão linear simples - regressão linear: ajuste de uma reta à nuvem de pontos - reta = função linear f(x) = ax + b ou y = ax + b - a é a inclinação ou coeficiente angular da reta. Pode ser interpretada também como a taxa de variação de y com x - Qual reta melhor se ajusta à nuvem de pontos? 15 Aula 04 – Relação entre duas variáveis Método dos mínimos quadrados - método que busca minimizar a soma dos quadrados das distâncias entre cada ponto da nuvem e a reta de regressão - a reta de regressão é: y = ax + b + ε Onde ε é o erro 16 Aula 04 – Relação entre duas variáveis Ajuste de curvas - relações/curvas não lineares - ainda usamos o método dos mínimos quadrados 17 Aula 04 – Relação entre duas variáveis Exercícios Slide 1 Slide 2 Slide 3 Slide 4 Slide 5 Slide 6 Slide 7 Slide 8 Slide 9 Slide 10 Slide 11 Slide 12 Slide 13 Slide 14 Slide 15 Slide 16 Slide 17