Buscar

RA2022202781-Lucas Santos-Estatística Aplicada ao Data Science-Vamos praticar unidade 1 docx

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Faça como milhares de estudantes: teste grátis o Passei Direto

Esse e outros conteúdos desbloqueados

16 milhões de materiais de várias disciplinas

Impressão de materiais

Agora você pode testar o

Passei Direto grátis

Você também pode ser Premium ajudando estudantes

Prévia do material em texto

Nome: Lucas da Silva Santos – RA:2022202781 – CENTRO UNIVERSITÁRIO FMU 
Curso: Engenharia Elétrica – Disciplina: Estatística Aplicada ao Dara Science 
Data: 03/11/2023 – Unidade 1 – Predições com Modelos de Regressão Linear 
 
___________________________________________________________________________ 
Vamos Praticar 1 
ESTATÍSTICA APLICADA AO DATA SCIENCE 
Analisando o estudo de caso e respondendo às suas perguntas: 
1. Quais foram as variáveis estudadas? 
R: O estudo envolveu as seguintes variáveis: 
✓ y: perda de peso ocorrida na primeira semana (kg) - Esta é a variável de saída que se 
deseja prever, ou seja, a resposta do estudo. 
✓ x1: tempo dedicado a atividades físicas na primeira semana (h) - Essa é uma variável 
preditiva contínua, quantitativa, que mede o tempo em horas dedicado às atividades 
físicas. 
✓ x2: indicador se a pessoa fez (1) ou não fez (0) dieta alimentar - Esta é uma variável 
preditiva binária, qualitativa, que representa se a pessoa aderiu (1) ou não aderiu (0) à 
dieta alimentar. 
 
2. Qual o tipo de cada variável, quantitativa ou qualitativa? Se quantitativa, qual sua 
unidade de medida? Se qualitativa, que níveis ou classes podem assumir? 
R: 
✓ y é uma variável quantitativa, medida em quilogramas (kg). 
✓ x1 é uma variável quantitativa, medida em horas (h). 
✓ x2 é uma variável qualitativa binária, com dois níveis: 0 para "não fez dieta" e 1 para "fez 
dieta". 
 
3. O que representa cada um dos quatro coeficientes do modelo de regressão linear 
múltipla? 
R: O modelo de regressão linear múltipla é representado pela equação: 
y = 1,25 + 0,15x1 + 0,20x2 + 0,30x1x2 
 
✓ O coeficiente 1,25 é o intercepto, que representa a perda de peso esperada quando x1 
e x2 são iguais a zero. 
✓ O coeficiente 0,15 representa o efeito do tempo dedicado às atividades físicas (x1) na 
perda de peso. 
✓ O coeficiente 0,20 representa o efeito de fazer dieta alimentar (x2) na perda de peso. 
✓ O coeficiente 0,30 representa o efeito cruzado entre o tempo dedicado às atividades 
físicas (x1) e a dieta alimentar (x2) na perda de peso. 
 
4. O efeito cruzado entre as variáveis x1 (tempo dedicado a atividades físicas na primeira 
semana) e x2 (se a pessoa fez ou não dieta alimentar) é positivo? Ou seja, um ajuda o 
outro na redução de peso das pessoas? 
R: O efeito cruzado é representado pelo coeficiente 0,30. Se esse coeficiente for 
positivo, isso indica que a combinação de fazer dieta alimentar (x2 = 1) e dedicar mais 
Nome: Lucas da Silva Santos – RA:2022202781 – CENTRO UNIVERSITÁRIO FMU 
Curso: Engenharia Elétrica – Disciplina: Estatística Aplicada ao Dara Science 
Data: 03/11/2023 – Unidade 1 – Predições com Modelos de Regressão Linear 
 
___________________________________________________________________________ 
tempo às atividades físicas (x1 aumenta) tem um efeito positivo na perda de peso. 
Portanto, sim, o efeito cruzado é positivo, sugerindo que a dieta alimentar e o aumento 
no tempo dedicado às atividades físicas juntos contribuem para uma maior perda de 
peso na primeira semana. 
 
5. Em que situações similares você poderia aplicar essa mesma técnica para gerar 
conhecimento a partir de dados? 
R: Essa técnica de regressão linear múltipla pode ser aplicada em uma variedade de 
situações semelhantes para gerar conhecimento a partir de dados, especialmente 
quando se deseja entender o relacionamento entre múltiplas variáveis independentes 
e uma variável dependente contínua. Alguns exemplos incluem: 
 
✓ Prever o desempenho acadêmico de estudantes com base em variáveis como horas de 
estudo, frequência às aulas, e estilo de aprendizado. 
✓ Avaliar o impacto de variáveis como idade, renda, educação e experiência no salário de 
indivíduos. 
✓ Investigar como variáveis como publicidade, preço e clima afetam as vendas de 
produtos. 
✓ Analisar como fatores como dieta, exercício e genética influenciam a perda de peso, 
como no estudo de caso apresentado. 
✓ Essa técnica é amplamente utilizada em pesquisa e análise de dados para entender os 
relacionamentos entre variáveis e fazer previsões com base nesses relacionamentos.

Continue navegando