Baixe o app para aproveitar ainda mais
Prévia do material em texto
Laboratório de Ciências Aula 2 Estatística O que é uma variável? � Dá-se o nome de variável à uma determinada catacterística a ser pesquisada em um estudo ou experimento. � Usualmente, as variáveis são representadas por letras maiúsculas, como X, Y, Z, ... � Para cada observação, a variável assume um único “valor” dos que podem ser a ela atritbuídos. � Por exemplo: � Variável: Sexo dos alunos da disciplina de Laboratório de ciências; � Respostas possíveis: Masculino e Feminino; � Observação: ou o aluno é do sexo feminino, ou o aluno é do sexo masculino. Tipos de variáveis � Variáveis qualitativas: Representam atributos ou qualidades. � Nominal: Sem ordem natural. � Ordinal: Com ordem natural. � Variáveis quantitativas: São de natureza numérica. � Discreta: Resultante de contagens. � Contínua: Proveniente de mensuração. Exemplos de tipos de variáveis Qualitativa Nominal � Sexo � Tipo de Instrumento Ordinal � Escolaridade � CondiçãoAmbiental Quantitativa Discreta � Número de filhos � Número de medições Continua � Altura � Tensão Elétrica Variáveis (Lei de Ohm) Observação X Y W Z 1 1,0 0,25 4,00 digital 2 2,0 0,55 3,64 digital 3 3,0 0,85 3,53 digital Onde: 4 4,0 1,20 3,33 digital X: Tensão Elétrica (Em volts) 5 5,0 1,40 3,57 digital Y: Corrente Elétrica (Em ampères) 6 1,0 0,40 2,50 analógico W: Resistência (Em Ohms) 7 2,0 0,65 3,08 analógico Z: Tipo de Instrumento 8 3,0 0,90 3,33 analógico 9 4,0 1,15 3,48 analógico 10 5,0 1,50 3,33 analógico Fonte: Medição realizada por alunos da turma 01 Objetivo do estudo: Relação entre variáveis quantitativas � Em diversas áreas de conhecimento, é comum o interesse por relacionar variáveis quantitativas. � Busca-se encontrar e mensurar o tipo de relação entre duas variáveis, objetivando ajustar um modelo que explique uma tendência apresentada pelas variáveis. � Por exemplo, pode-se querer estudar a relação entre a altura dos pais e a altura dos filhos. � A estatística oferece ferramentas que permitem o estudo entre duas ou mais variáveis aleatórias. Ferramentas Estatísticas � Correlação: Um valor que varia de -1 a 1 e fornece um indicativo da relação entre duas variáveis aleatórias. � Regressão: Utilizada para relacionar duas variáveis por meio de um modelo, busca fornecer estimativas para determinada variável com base em uma outra variável. Desenvolveremos a relação linear entre variáveis. Exemplo: Lei de Ohm A partir das informações das medições da turma 01 apresentadas na tabela anterior, desejamos estudar a relação que existe entre as medições de Tensão Elétrica (X) e Corrente Elétrica (Y). O interesse final é saber se é possível obter um valor de Corrente Elétrica, conhecendo somente a tensão elétrica que foi passada por determinado material, nesse caso grafite. Variáveis (Lei de Ohm) Observação 1 2 3 4 5 6 7 8 9 10 X 1,0 2,0 3,0 4,0 5,0 1,0 2,0 3,0 4,0 5,0 Y 0,25 0,57 0,85 1,20 1,40 0,39 0,65 0,90 1,17 1,90 Onde: X: Tensão Elétrica (Em volts) Y: Corrente Elétrica (Em ampères) Questão 1: É possível descrever o tipo de relação entre as variáveis? � Duas variáveis são correlacionadas quando uma esta relacionada à outra de alguma maneira. � A verificação da correlação pode ser realizada via um Gráfico de Dispersão. Plotando os valores de cada observação em dois eixos, onde cada eixo corresponde a uma das variáveis. � O Gráfico de Dispersão permite a verificação visual de algum tipo de relação entre as variáveis. Exemplos: Gráficos de Dispersão Situação 1: Existe uma relação não linear. Situação 2: Existe uma relação linear. Situação 3: Não existe uma relação. Gráfico de Dispersão (Lei de Ohm) 0,00 0,20 0,40 0,60 0,80 1,00 1,20 1,40 1,60 1,80 2,00 0,0 1,0 2,0 3,0 4,0 5,0 6,0 C o r r e n t e E l é t r i c a ( Y ) Tensão Eletrica (X) Gráfico de Dispersão: Tensão Elétrica vs. Corrente Elétrica Questão 2: É possível quantificar essa relação? � Existe uma medida numérica de intensidade para a relação linear entre valores de duas variáveis quantitativas. � Esta é conhecida como Coeficiente de Correlação Linear. � Denotada por ρ. Existem medidas para relações não lineares, porém estamos estudando somente o caso de uma relação linear simples. Coeficiente de Correlação Linear � = ���� ���� � Em que: � �� e �� representam o desvio padrão das variáveis X e Y respectivamente. (Aula 1) � ���� é a covariância entre as variáveis X e Y, dada pela seguinte expressão: ���� = ∑ (�� − �̅)(�� − ��) � ��� � Coeficiente de Correlação Linear � Os valores de ρ estão entre -1 e 1, isto é, -1 ≤ ρ ≤ 1. � Quando ρ → 0 ,então, não existe correlação linear significativa. � Quando ρ → -1 ou 1,então, existe correlação linear significativa. � Se ρ está perto de 1, há correlação positiva. � Se ρ está perto de -1, há correlação negativa. Coeficiente de Correlação Linear (Lei de Ohm) ρ = 0,962 Note que ρ→ 1 ,então: •Existe correlação linear significativa. •Há correlação positiva. Questão 3: É possível propor um modelo estatístico? Observamos que existe uma correlação linear evidente entre aTensão Elétrica e a Corrente Elétrica. É necessário um modelo que permita usar os valores da Tensão Elétrica de diferentes pedaços de grafite para obter possíveis valores da Corrente Elétrica, sem a necessidade de realizar o experimento novamente. Questão 3: É possível propor um modelo estatístico? � Um modelo de regressão linear simples descreve uma relação entre uma variável independente (ou explicativa) X e uma variável dependente (ou resposta) Y, da seguinte maneira: � = �� + ��� + � � Em que: �� e �� são constantes desconhecidas e � é o erro aleatório. Contexto histórico � Francis Galton (inglês, 1822-1911), primo de Charles Darwin, fundou e defendia a eugenia (melhoramento genético humano); � Estudou a hereditariedade de diversas características humanas; � Na última década do século 19, Galton estudava a relação existente entre a estatura dos pais e dos filhos; � Filhos de pais de estatura elevada tendiam a ser altos mas não tão altos quanto seus pais; � Filhos de pais de menor estatura tendiam a ser baixos mas não tão baixos quanto seus pais . Contexto histórico Alt (cm) Obs 1 Obs 21 Obs 29 Obs 40 Pai 134,74 153,95 172,01 193,94 Filho 144,39 161,99 169,54 186,28 Regressão para a mediocridade Alt_filho = 61,13cm + 0,63*Alt_pai + erro � = 0,98 Especificando modelo (Lei de Ohm) � = �� + ��� + � Em que: � representa a corrente elétrica (Ampéres); � representa a tensão elétrica (Volts). Serão utilizadas as 10 observações apresentadas anteriormente; O modelo visa fornecer valores de corrente elétrica para qualquer valor de tensão. Encontrando os valores para β0 e β1 Existem muitas retas possíveis. Procura-se aquela que melhor se ajuste a todos os dados. Observa-se as distâncias entre o valor real e o seu correspondente na reta. � � � = � = �� + ��� �� ��� �� Método de Mínimos Quadrados • As n observações da amostra podem ser expressadas por: � � = � 0 + � 1 �� + ��, � = 1,… ,� • Ajusta-se a reta que resulta no menor valor para a soma dos erros ao quadrado ∑ �� 2� �=1 . Modelo de Regressão (Lei de Ohm) Coeficiente de Determinação • É um indicador para verificar o ajuste do modelo de regressão. • É denotado por R2 . • Para a regressão linear simples é o valor do coeficiente de correlação linear ao quadrado. R2 = (ρ)2 • No exemplo da Lei de Ohm, temos: R2 = (0,962 )2 = 0,9255 Verificando os Resíduos • De um modo similar ao apresentado para a avaliação de erros, verificaremos as diferenças entre os valores observados e os valores calculados pelo modelo proposto. • Estas diferenças são denominadas Resíduos. � = �� − � � Analisando os Resíduos ? Variáveis (Lei de Ohm) Observação X Y W Z 1 1,0 0,25 4,00 digital 2 2,0 0,55 3,64 digital 3 3,0 0,85 3,53 digital Onde: 4 4,0 1,20 3,33 digital X: Tensão Elétrica(Em volts) 5 5,0 1,40 3,57 digital Y: Corrente Elétrica (Em ampères) 6 1,0 0,40 2,50 analógico W: Resistência (Em Ohms) 7 2,0 0,65 3,08 analógico Z: Tipo de Instrumento 8 3,0 0,90 3,33 analógico 9 4,0 1,15 3,48 analógico 10 5,0 1,50 3,33 analógico Fonte: Medição realizada por alunos da turma 01 Variáveis (Lei de Ohm) Observação 1 2 3 4 5 6 7 8 9 10 X 1,0 2,0 3,0 4,0 5,0 1,0 2,0 3,0 4,0 5,0 Y 0,25 0,57 0,85 1,20 1,40 0,39 0,65 0,90 1,17 1,90 Onde: X: Tensão Elétrica (Em volts) Y: Corrente Elétrica (Em ampères) Modelo de Regressão (2) (Lei de Ohm) Modelo de Regressão (Lei de Ohm)
Compartilhar