Logo Passei Direto
Buscar
Material

Prévia do material em texto

GAAL UFU Página 15 de 157 páginas
Caṕıtulo 2
Vetores e Coordenadas Cartesianas
Neste caṕıtulo começamos o estudo dos vetores, que são ferramentas matemáticas bastante úteis em várias áreas das
Ciências Exatas como, por exemplo, na F́ısica e nas Engenharias. Os vetores podem constituir uma alternativa útil e
simples na resolução de certos problemas de Geometria Euclidiana Plana, mas é na resolução de problemas envolvendo
Geometria Anaĺıtica no espaço euclidiano tridimensional que os vetores tornam-se, frequentemente, indispensáveis.
Dáı a importância de seu estudo pormenorizado.
Ao final deste caṕıtulo há três seções de exerćıcios. A primeira delas (página 49) é oriunda do chamado “Projeto
Prossiga de Geometria Anaĺıtica” que ocorreu no ano 2016, na Universidade Federal de Uberlândia, e do qual este
autor fez parte, juntamente com cerca de uma dezena de outros professores. Nesta primeira seção de exerćıcios, parte
deles estão resolvidos e servem de modelos para as resoluções dos demais. Esta é a seção “principal” de exerćıcios e
é a que o leitor deve estudar, pois é parte complementar da teoria . A segunda seção de exerćıcios (página 62)
é “extra”. Trata-se de uma seção com muitos exerćıcios resolvidos que são clássicos na Geometria Euclidiana. Esta
segunda seção de exerćıcios é destinada, principalmente, para leitores do Curso de Matemática. Por fim, temos uma
terceira seção “extra” de exerćıcios propostos (página 84). São exerćıcios análogos aos da primeira seção, e ficam como
aprofundamento para aqueles que decidirem fazê-los.
Como vamos utilizar muitos conceitos advindos da Geometria Euclidiana Plana e Espacial básica (de Ensino
Médio), entendemos que é conveniente fazer uma pequena recordação das notações clássicas mais usuais da Geometria
e que são utilizadas neste texto. Elas seguem abaixo:
• Pontos: letras latinas maiúsculas (A,B,C, . . .).
• Segmento com extremos A e B: “segmento AB” ou, simplesmente, AB.
• Comprimento do segmento AB: denotamos simplesmente por “AB”, sem a barra superior. Também utilizamos
letras latinas minúsculas para designar comprimentos (a, b, c, . . .). Alguns textos também trazem a notação |AB|.
Observação importante: quando não houver perigo de confusão, denotamos “AB” tanto para o segmento AB (que é
um conjunto de pontos), quanto para o comprimento do segmento AB (que é um número real).
• Semirreta com origem A contendo B: “semirreta AB” ou, simplesmente,⇀AB, ou −→AB (quando não houver perigo
de confusão com a notação de vetor que veremos adiante). Alguns textos também utilizam a notação SAB.
• Retas: letras latinas minúsculas (r, s, t, . . .). Também utilizamos a notação
←→
AB para designar a reta que contém os
pontos distintos A e B.
• Planos: letras gregas minúsculas (α,β, γ, . . .).
• Ângulo de vértice A e lados contendo os segmentos AB e AC: escrevemos BÂC ou CÂB ou, simplesmente,
 (quando não houver perigo de confusão).
• Medida de ângulo: letras gregas minúsculas (α,β, γ, . . .). As vezes, a notação de ângulo é, também, utilizada
para indicar a medida do ângulo.
Antes de começarmos: nosso ambiente de trabalho é, predominantemente, o espaço euclidiano tridimensional.
Portanto, neste caṕıtulo, a menos que se diga o contrário, segmentos, retas e demais objetos geométricos, estão sendo
considerados neste espaço.
2.1 Vetores: abordagem geométrica
Nas Ciências Exatas, é muito comum trabalharmos com dois tipos bastantes distintos de grandezas:
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 16 de 157 páginas UFU GAAL
Grandezas escalares: que são caracterizadas apenas por um único valor numérico como, por exemplo, temperatura,
distância, massa, área, volume, etc.
Grandezas vetoriais: que são caracterizadas por um valor numérico, direção e sentido de percurso como, por
exemplo, velocidade, aceleração, força, etc.
(1) Em grandezas vetoriais, a direção é determinada por uma reta no espaço. Retas paralelas determinam a mesma
direção;
(2) Fixada uma direção, ou seja, fixada uma reta, há dois posśıveis sentidos de percurso, ou orientações;
(3) Consideremos, em todo o desenvolvimento que faremos nessas notas, que uma unidade de medida de compri-
mento foi fixada .
Observações:
(i) Formalmente, um segmento AB da reta r é constitúıdo por todos os pontos da reta r que estão entre A e B.
Quando A = B dizemos que o segmento de reta é degenerado ou nulo. O comprimento de um segmento de reta
degenerado é, por convenção, zero. No que se segue, a menos que se diga o contrário, segmento significa segmento não
degenerado.
(ii) Uma direção também pode ser determinada por um segmento de reta no espaço. Portanto, segmentos paralelos
determinam a mesma direção. Além disso, fixado um segmento, há dois posśıveis sentidos de percurso ou orientações.
Um segmento de reta AB com sentido de percurso fixado de A para B será chamado de segmento orientado,
sendo A a origem e B o extremo.
A B r
sentido de percurso
( )origem ( )extremo
Dois segmentos orientados paralelos podem ter o mesmo sentido de percurso ou sentidos de percurso contrários.
Vejamos como formalizar esses conceitos:
Sejam AB e A′B′ dois segmentos orientados paralelos não colineares, sendo A, A′ as origens e B, B′ os extremos.
• Quando os segmentos AA′ e BB′ possuem intersecção vazia, dizemos que os segmentos orientados AB e A′B′
possuem o mesmo sentido de percurso.
• Quando os segmentos AA′ e BB′ possuem um ponto P como interseção, dizemos que os segmentos orientados AB
e A′B′ possuem o sentidos de percurso contrários.
A
A¢
B¢
B
A A¢
B¢
B
P
Sejam AB e A′B′ segmentos orientados colineares, ambos sobre uma reta r.
• Quando AB e A′B′ induzem o mesmo sentido de percurso sobre a reta r, dizemos que os segmentos orientados
AB e A′B′ possuem o mesmo sentido de percurso.
• Quando AB e A′B′ induzem sentidos de percurso contrários sobre a reta r, dizemos que os segmentos orientados
AB e A′B′ possuem sentidos de percurso contrários.
Consideremos um segmento orientado AB com origem em A e extremo em B. Um segmento orientado CD com
origem em C e extremo em D paralelo a AB, com o mesmo comprimento de AB e com mesmo sentido de percurso de
AB é chamado de segmento orientado equipolente a AB. Neste caso, dizemos ainda que os segmentos orientados AB
e CD são equipolentes. Também consideramos que um segmento orientado é equipolente a ele próprio. Além disso,
todos os segmentos degenerados são considerados equipolentes.
Ao conjunto de todos os segmentos orientados equipolentes ao segmento orientado AB chamamos de vetor com
origem em A e extremo em B e indicamos por
−→
AB. Ao conjunto dos segmentos degenerados chamamos de vetor
nulo.
Dizemos que o segmento orientado AB é um representante do vetor
−→
AB, ou que o vetor
−→
AB está representado
pelo segmento orientado AB. Qualquer segmento orientado CD equipolente a AB pode ser representante do vetor
−→
AB,
ou seja,
−→
AB =
−→
CD.
Representamos graficamente um vetor
−→
AB por uma seta (ou flecha) com origem em A e extremo em B.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 17 de 157 páginas
A
B
v
C
D
v
Notemos que, pela forma como foi definido, um vetor não depende de sua posição no espaço, ou seja, um determi-
nado vetor pode ter um representante com origem em qualquer ponto do espaço. Desta forma, é natural representarmos
vetores por uma única letra (geralmente com uma seta em cima), sem especificar os pontos de origem e extremo de
um representante. Na figura acima temos ~v =
−→
AB =
−→
CD.
Observação: Nunca devemos falar “vetores equipolentes”. Conforme definimos acima, a relação de equipolência é
uma relação binária envolvendo segmentos orientados(1). Se o segmento orientado AB é equipolenteao segmento
orientado CD, então os vetores
−→
AB e
−→
CD são iguais, ou seja,
−→
AB =
−→
CD.
Definições Complementares
• (1) O chamado vetor nulo, definido acima, pode ser representado com origem e extremo coincidentes, ou seja,
~v =
−→
AA, por exemplo. Simplificadamente podemos escrever ~v = ~0. É claro que, neste caso, o vetor nulo não determina
direção e, portanto, também não determina sentido.
• (2) O comprimento de um vetor ~v é o comprimento de qualquer segmento orientado que o represente. Indicamos
o comprimento de ~v por ||~v|| ou |~v|. As vezes o comprimento de um vetor também é chamado de módulo ou norma .
O vetor nulo possui comprimento também nulo, ou seja ||~0|| = 0.
• (3) Os vetores não nulos ~u e ~v são vetores paralelos, ou possuem mesma direção, quando segmentos orientados que
os representem são paralelos ou colineares, conforme exemplos na figura abaixo. Indicamos por ~u//~v. Convencionamos
que o vetor nulo é paralelo a qualquer outro vetor.
w
u v w// //
u v
• (4) Dois vetores não nulos ~u e ~v paralelos possuem mesmo sentido quando possuem segmentos orientados que os
representem com mesmo sentido de percurso, caso contrário, ~u e ~v possuem sentidos opostos.
• (5) Dizemos que dois vetores não nulos ~u e ~v são vetores iguais, ou possuem mesmo comprimento, direção e
sentido, quando segmentos orientados que os representem possuem mesmo comprimento, direção e sentido. Neste
caso, escrevemos ~u = ~v.
• (6) O vetor oposto de um vetor não nulo ~v é o vetor paralelo e de mesmo comprimento de ~v mas que possui sentido
oposto ao sentido de ~v. Indicamos o vetor oposto de ~v por −~v (figura abaixo). Desta forma, temos que se ~v =
−→
AB,
então −~v = −
−→
AB =
−→
BA. Além disso, −~v//~v e ||−~v|| = ||~v||.
A
B
v
-v
B
A
• (7) Um vetor ~v é dito vetor unitário quando ||~v|| = 1.
• (8) O versor de um vetor não nulo ~v é o vetor unitário que possui a mesma direção e sentido de ~v (adiante veremos
como calcular o versor de um vetor não nulo).
• (9) Dois vetores não nulos ~u e ~v são vetores ortogonais quando possuem segmentos orientados que os representem
que sejam perpendiculares. Indicamos por ~u ⊥ ~v (figura abaixo). Convencionamos que o vetor nulo é ortogonal a
qualquer vetor.
1Em Matemática, o conjunto de todos os segmentos orientados equipolentes ao segmento orientado AB é chamado de classe de equi-
polência do segmento orientado AB. Isto significa que um vetor é uma classe de equipolência de segmentos orientados. A relação de
equipolência entre segmentos orientados do espaço é um caso particular daquilo que chamamos em Matemática de relação de equivalência.
Formalmente, uma relação de equivalência em um conjunto não vazio C é uma relação binária entre elementos desse conjunto, que indicamos
por ∼, cumprindo três propriedades:
(i) a ∼ a para qualquer a ∈ C (reflexividade).
(ii) a ∼ b⇒ b ∼ a para quaisquer a, b ∈ C (simetria).
(iii) a ∼ b e b ∼ c⇒ a ∼ c para quaisquer a, b, c ∈ C (transitividade).
A relação de equipolência no conjunto dos segmentos orientados do espaço, incluindo os segmentos degenerados, cumpre as três condições
acima.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 18 de 157 páginas UFU GAAL
A
B
v
uO
v
u
• (10) Três ou mais vetores não nulos são vetores coplanares quando possuem segmentos orientados que os repre-
sentem que sejam coplanares, conforme exemplo na figura abaixo. Notemos que dois vetores não nulos são sempre
coplanares. O vetor nulo é coplanar a qualquer conjunto de vetores coplanares.
coplanares não coplanares
v
u
w
v
u
w
Exemplo 2.1 Consideremos a figura abaixo:
A B
C
O
E
F
G
HD
Nesta figura temos o losango EFGH inscrito no retângulo ABCD (não quadrado), sendo O o ponto de intersecção
das diagonais do losango. Os pontos E, F, G e H são pontos médios dos lados DA, AB, BC e CD, respectivamente.
A seguir, temos diversas afirmações envolvendo vetores. Vamos decidir quais são verdadeiras e quais são falsas
baseados nas diversas definições dadas acima.
(a)
−→
EO =
−−→
OG
(e) ||
−−→
OH|| = ||
−−→
DH||
(i)
−→
AF//
−→
CD
(m)
−→
EO ⊥
−→
CB
(b)
−→
AF =
−→
CH
(f)
−→
EH =
−→
CO
(j)
−→
GF//
−→
HG
(n)
−−→
AO ⊥
−→
HF
(c)
−−→
DO =
−→
HG
(g) ||
−→
AC|| = ||
−→
BD||
(k)
−−→
AO//
−→
OC
(o)
−→
OB = −
−→
FE
(d) ||
−→
OC|| = ||
−→
BO||
(h) ||
−−→
OA|| = ||
−→
DB||/2
(l)
−→
AB ⊥
−−→
OH
(p)
−→
AB,
−→
AC e
−−→
AD são coplanares
Temos:
(a) Verdade. Os vetores
−→
EO e
−−→
OG possuem mesmo comprimento, direção e sentido. Logo, são iguais.
(b) Falso. Embora
−→
AF e
−→
CH possuam mesmo comprimento e direção, são vetores com sentidos opostos.
(c) Verdade. Os vetores
−−→
DO e
−→
HG possuem mesmo comprimento, direção e sentido. Logo, são iguais.
(d) Verdade. Embora
−→
OC e
−→
BO possuam direções diferentes, são vetores com o mesmo comprimento.
(e) Falso. O retângulo não é quadrado. Logo, os comprimentos de
−−→
OH e
−−→
DH são diferentes.
(f) Falso. Embora
−→
EH e
−→
CO possuam mesmo comprimento e direção, são vetores com sentidos opostos.
(g) Verdade. Embora
−→
AC e
−→
BD possuam direções diferentes, são vetores com o mesmo comprimento.
(h) Verdade. Embora
−−→
OA e
−→
DB possuam direções diferentes, o comprimento de 1
2
−→
DB é igual ao comprimento de
−−→
OA.
(i) Verdade. Os vetores
−→
AF e
−→
CD possuem a mesma direção (sentidos e comprimentos diferentes). Logo, são paralelos.
(j) Falso. Os vetores
−→
GF e
−→
HG possuem direções diferentes. Logo, não são paralelos.
(k) Verdade. Os vetores
−−→
AO e
−→
OC possuem mesmo comprimento, direção e sentido. Logo, são paralelos.
(l) Verdade. Os vetores
−→
AB e
−−→
OH definem retas perpendiculares (no ponto F). Logo, são vetores ortogonais.
(m) Verdade. Os vetores
−→
EO e
−→
CB definem retas perpendiculares (no ponto G). Logo, são vetores ortogonais.
(n) Falso. Os vetores
−−→
AO e
−→
HF definem retas não perpendiculares. Logo, não são vetores ortogonais.
(o) Verdade. Os vetores
−→
OB e
−→
EF = −
−→
FE possuem mesmo comprimento, direção e sentido. Logo, são iguais.
(p) Verdade. Os vetores
−→
AB,
−→
AC e
−−→
AD estão representados sobre um retângulo, que é uma figura plana. Logo, são
coplanares.
Operações com Vetores
Adição: sejam ~u e ~v vetores no espaço. Tomemos representantes de ~u e ~v de tal modo que o extremo de ~u coincida
com a origem de ~v, ou seja, ~u =
−→
AB e ~v =
−→
BC. Definimos o vetor soma ~u+~v com sendo
~u+~v =
−→
AB+
−→
BC =
−→
AC .
A figura abaixo ilustra geometricamente a operação de adição de vetores.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 19 de 157 páginas
u
v
v
u
DA
B C
u
v
A
B C
u
v
u
v
+
u v+
Observações:
(1) Podeŕıamos tomar ~u =
−→
AB e ~v =
−−→
AD. Logo, ~u + ~v poderia ser representado pela diagonal AC do paralelogramo
baseado em AB e AD, conforme a figura acima à direita. Por esse motivo, às vezes, a adição é chamada de “Regra do
paralelogramo”.
(2) A soma de três ou mais vetores processa-se de modo análogo, por exemplo, se ~u =
−→
PQ, ~v =
−→
QR e ~w =
−→
RS, então
~u+~v+ ~w =
−→
PS.
Proposição 2.1 (Propriedades da adição de vetores) Sejam ~u, ~v e ~w vetores no espaço. Então, valem as seguintes
propriedades:
(i) Comutativa: ~u+~v = ~v+ ~u;
(ii) Associativa: (~u+~v) + ~w = ~u+ (~v+ ~w);
(iii) O vetor nulo é elemento neutro aditivo: ~u+~0 = ~u;
(iv) Todo vetor não nulo ~u possui um elemento oposto, indicado por −~u, tal que: ~u+ (−~u) = ~0.
O vetor ~u+ (−~v) se escreve ~u−~v e é chamado de diferença entre ~u e ~v.
Observemos que o vetor ~u − ~v possui representante que forma uma das diagonais de um paralelogramo baseado
em representantes de ~u e ~v, conforme exemplo na figura abaixo (a outra diagonal é a do representante da soma).
u
-v
v
uu v-
Exemplo 2.2 Escrevamos os vetores ~a,~b,~c,~d,~e e ~f em função de ~u e ~v na figura abaixo.
d
e
u
f
c
v
a
b
Temos:
~a = ~u+~v ~b = −~u+~v ~c = −~u ~d = −~u−~v ~e = −~v ~f = ~u−~v
Exemplo 2.3 Mostremos que
−→
AB−
−→
AC =
−→
CB.
Basta lembrar que −
−→
AC =
−→
CA e a propriedade comutativa da adição de vetores:
−→
AB−
−→
AC =
−→
AB+
−→
CA =
−→
CA+
−→
AB =
−→
CB.
Multiplicação de número real por vetor: sejam α ∈ R e ~v vetor no espaço. Definimos o vetor α~v de tal modo
que:
• comprimento: o comprimento de α~v é ||α~v|| = |α|.||~v|| .
• direção: quando α 6= 0 e ~v 6= ~0, a direção de α~v é a direção de ~v. Quando α = 0 ou ~v = ~0, α~v é o vetor nulo.
• sentido: quando α > 0 o sentido de α~v é o mesmo de ~v. Quando α < 0 o sentido de α~v é o oposto ao de ~v.
A figura abaixo ilustra alguns exemplos geométricos da operação de multiplicação de vetor por escalar.
-2v
v 3v
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 20 de 157 páginas UFU GAAL
Proposição 2.2 (Propriedades da multiplicação de número real por vetor) Sejam α,β ∈ R e ~u,~v vetores no espaço.
Então, valem as seguintes propriedades:
(i) Associativa: α (β~v) = (αβ)~v;
(ii) Distributiva em relação à soma de vetores: α (~u+~v) = α~u+ α~v;
(iii) Distributiva em relação à soma de números reais: (α+ β)~v = α~v+ β~v;
(iv) O número real 1 é elemento neutro multiplicativo: 1~v = ~v.
Exemplo 2.4 Consideremos a figura abaixo:
A B
C
O
E
F
G
HD
Nesta figura temos o losango EFGH inscrito no retângulo ABCD (não quadrado), sendo O o ponto de intersecção
das diagonais do losango. Os pontos E, F, G e H são pontos médios dos lados DA, AB, BC e CD, respectivamente.
Determinemos representantes para os vetores abaixo expressando-os com origem no ponto A.
(a)
−→
OC+
−→
CH
(f) 2
−→
OE+ 2
−→
OC
(b)
−→
EH+
−→
FG
(g)
−→
BC/2+
−→
EH
(c) 2
−→
AE+ 2
−→
AF
(h)
−→
FE+
−→
FG
(d)
−→
EH+
−→
EF
(i)
−−→
OG−
−−→
HO
(e)
−→
EO+
−→
BG
(j)
−→
AF+
−→
FO+
−−→
AO
Temos:
(a)
−→
OC+
−→
CH =
−−→
OH =
−−→
AE;
(c) 2
−→
AE+ 2
−→
AF =
−−→
AD+
−→
AB =
−−→
AD+
−→
DC =
−→
AC;
(e)
−→
EO+
−→
BG =
−→
AF+
−→
FO =
−−→
AO;
(g)
−→
BC/2+
−→
EH =
−→
BG+
−→
EH =
−→
AE+
−→
EH =
−→
AH;
(i)
−−→
OG−
−−→
HO =
−→
AF+
−−→
OH =
−→
AF+
−→
FO =
−−→
AO;
(b)
−→
EH+
−→
FG =
−−→
AO+
−→
OC =
−→
AC;
(d)
−→
EH+
−→
EF =
−−→
AO+
−→
OB =
−→
AB;
(f) 2
−→
OE+ 2
−→
OC =
−→
GE+
−→
AC =
−→
BA+
−→
AC =
−→
BC =
−−→
AD;
(h)
−→
FE+
−→
FG =
−−→
OD+
−−→
AO =
−−→
AO+
−−→
OD =
−−→
AD;
(j)
−→
AF+
−→
FO+
−−→
AO =
−−→
AO+
−→
OC =
−→
AC.
Observações:
(1) Chamemos o conjunto de todos os vetores no espaço euclidiano tridimensional de V3. A operação de adição é
“interna” a V3, isto é, somam-se dois elementos de V3 e o resultado é um novo elemento de V3. Já a multiplicação
de vetor por escalar é uma operação “externa” a V3, uma vez que envolve elementos (os escalares) que não estão em
V3. Simbolicamente:
+ : V3 × V3 −→ V3
(~u,~v) 7−→ ~u+~v e · : R× V3 −→ V3(α, ~u) 7−→ α~u .
(2) As 4 propriedades de adição de vetores, juntamente com as 4 propriedades de multiplicação de vetor por escalar,
conferem a V3 uma estrutura algébrica chamada de espaço vetorial. Esta estrutura pode ser generalizada para
conjuntos diferentes do conjunto dos vetores, e é objeto de estudos em uma área da Matemática chamada Álgebra
Linear.
(3) A regra “em uma equação vetorial podemos trocar vetores de membro invertendo o sinal” é válida, ou seja:
~u+~v = ~w⇒ ~u = ~w−~v e decorre naturalmente das propriedades da adição de vetores.
(4) Quando α = 1
β
∈ R∗ e ~u é vetor no espaço, às vezes, denotamos α~u por ~u
β
, ou seja, α~u = 1
β
~u = ~u
β
.
A proposição abaixo é extremamente importante. Ela relaciona o conceito de paralelismo entre vetores a uma
equação vetorial de proporcionalidade.
Proposição 2.3 (Condição de paralelismo entre vetores) Os vetores ~u e ~v, ~v 6= ~0, são paralelos se, e somente se,
existe α ∈ R tal que ~u = α~v, ou seja,
~u//~v⇐⇒ ∃α ∈ R tal que ~u = α~v .
Observação: ~u = α~v exprime algebricamente a noção geométrica de paralelismo entre vetores. É costume dizer que
se dois vetores são paralelos, então eles são proporcionais.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 21 de 157 páginas
Demonstração da Proposição 2.3.
Devemos mostrar dois resultados:
(a) Se ~u//~v, então ∃α ∈ R tal que ~u = α~v.
(b) Se ∃α ∈ R tal que ~u = α~v, então ~u//~v.
Para mostrar o item (a), devemos exibir uma expressão para α.
(a − i) Se ~u e ~v possuirem o mesmo sentido, façamos
α = ||
~u||
||~v|| .
Dáı, α~v = ||
~u||
||~v||
~v será um vetor de norma ||~u|| (pois
∥∥∥ ||~u||||~v||~v∥∥∥ = ||~u||||~v|| ||~v|| = ||~u||), com mesma direção e sentido de ~u,
ou seja, ||
~u||
||~v||
~v é o próprio ~u:
~u = ||
~u||
||~v||
~v = α~v .
(a − ii) Se ~u e ~v possuirem sentidos opostos, façamos
α = − ||
~u||
||~v|| .
Dáı, α~v = − ||
~u||
||~v||
~v será um vetor de norma ||~u|| (pois
∥∥∥− ||~u||||~v||~v∥∥∥ = ∣∣∣− ||~u||||~v|| ∣∣∣ ||~v|| = ||~u||||~v|| ||~v|| = ||~u||), com mesma
direção e sentido de ~u, ou seja, − ||
~u||
||~v||
~v é o próprio ~u:
~u = − ||
~u||
||~v||
~v = α~v .
Quanto ao item (b):
Se ∃α ∈ R tal que ~u = α~v, então ~u//α~v (vetores iguais são paralelos).
Mas, por definição, α~v//~v.
Logo, pela transitividade do paralelismo, ~u//~v, como queŕıamos. �
Exemplo 2.5 (Versor) Calculemos o versor de um vetor ~v 6= ~0.
Como ~v 6= ~0, então ||~v|| 6= 0 e podemos considerar no número real positivo α = 1
||~v|| .
Consideremos o vetor ~u = α~v = 1
||~v||
~v.
Pela Proposição 2.3 temos ~u//~v.
De α = 1
||~v|| > 0 temos ~u e ~v com o mesmo sentido.
Por fim, ||~u|| = ||α~v|| =
∥∥∥ 1||~v||~v∥∥∥ = ∣∣∣ 1||~v|| ∣∣∣ .||~v|| = 1||~v|| .||~v|| = 1, ou seja, ~u é vetor unitário com a mesma direção e
sentido de ~v. Logo,
~u = ~v
||~v||
é o versor de ~v 6= ~0.
Exemplo 2.6 Se ||~u|| = 5, calculemos os versores de ~u e de −10~u.
O versor de ~u é ~u
||~u|| =
1
5
~u. (pois ||~u|| = 5).
O versor de −10~u é −10~u
||−10~u|| , ou seja, −
1
5
~u pois:
−10~u
||−10~u|| =
−10~u
|−10|.||~u|| =
−10~u
10.5
(pois ||~u|| = 5) = −~u
5
= −1
5
~u.
Exemplo 2.7 Mostremos que o segmento que une os pontos médios de dois lados de um triângulo é paralelo ao
terceiro lado, e possui comprimento igual à metade do comprimento deste lado.
Considere o triângulo ABC com M e N pontos médios dos lados AC e BC, respectivamente:
A B
N
C
M
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 22 de 157 páginas UFU GAAL
Se provarmos que
−−→
MN = 1
2
−→
AB, então o segmento MN será paralelo ao lado AB (Proposição 2.3) e, ||
−−→
MN|| =∥∥∥12−→AB∥∥∥ = 12 ||−→AB||, ou seja, MN = AB2 , provando o que queremos.
Assim:
−−→
MN =
−−→
MC+
−→
CN = 1
2
−→
AC+ 1
2
−→
CB (pois
−−→
AM =
−−→
MC e
−→
CN =
−→
NB)⇒
−−→
MN = 1
2
Ä−→
AC+
−→
CB
ä⇒ −−→MN = 1
2
−→
AB
Nota Complementar.
É posśıvel definir uma operação de adição entre ponto e vetor no espaço euclidiano tridimensional. Esta operação
é, na verdade, uma consequência da adição de vetores, muito embora possa parecer um pouco estranha à primeira
vista.
A operação de adição entre ponto e vetor torna-se bastante natural quando trabalhamos com coordenadas,
conforme veremos nas Seção 2.2 adiante.
Vamos à definição:
Soma de ponto com vetor: Sejam P e ~u ponto e vetor no espaço euclidiano. Definimos a soma do ponto P com
o vetor ~u como sendo o ponto Q tal que o segmento orientado PQ, com origem em P e extremo em Q seja um
representante de ~u, ou seja,
−→
PQ = ~u.
Note que, uma vez fixada a origem P, o ponto Q é único, pois o comprimento, a direção e o sentido de
−→
PQ estão
univocamente determinados por −→u . Costumamos escreverP + ~u = Q. Assim:
P + ~u = Q⇐⇒ ~u = −→PQ⇐⇒ ~u = Q− P .
P
Q
u
Propriedades da operação de adição entre ponto e vetor.
Para quaisquer P e Q pontos e ~u e ~v vetores do espaço temos:
(i) P +~0 = P (elemento neutro);
(ii) P + ~u = P +~v⇒ ~u = ~v (Lei do cancelamento de pontos);
(iii) (P + ~u) +~v = P + (~u+~v) (associativa);
(iv) P + ~u = Q+ ~u⇒ P = Q (Lei do cancelamento de vetores);
(v) (P − ~u) + ~u = P (elemento oposto).
Ângulo Formado por Vetores
Embora vetores não dependam previamente de pontos de origem fixados no espaço, podemos definir ângulo entre
dois vetores do seguinte modo:
Consideremos vetores não nulos ~u e ~v no espaço. Definimos o ângulo formado pelos vetores ~u e ~v como sendo
o ângulo formado por dois segmentos orientados representantes de ~u e ~v tomados com a mesma origem.
O q
v
u
Q
P
O
q
v
u
Q
P
O
q
vu
QP
Em particular, ~u e ~v são ditos ortogonais quando o ângulo por eles formado for um ângulo reto. A notação
utilizada, neste caso, é ~u ⊥ ~v.
Convencionamos que o vetor nulo é ortogonal a qualquer outro vetor.
Da Geometria Euclidiana sabemos que a “abertura” de um ângulo pode variar desde um ângulo nulo até um ângulo
raso e, portanto, o mesmo ocorre com os vetores. Em termos de medidas, dois vetores ~u e ~v não nulos podem formar
um ângulo de medida θ tal que 0 6 θ 6 π (radianos) ou 0◦ 6 θ 6 180◦.
No caso do vetor nulo, como foi convencionado que ele é ortogonal a qualquer outro vetor, também convencionamos
que a medida θ de um ângulo envolvendo o vetor nulo é θ = π
2
rad ou θ = 90◦.
A noção de ângulo entre vetores será muito útil quando trabalharmos com os produtos envolvendo vetores, conforme
veremos adiante.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 23 de 157 páginas
Exemplo 2.8 Sabendo-se que o ângulo formado pelos vetores ~u e ~v mede 60◦, determinemos a medida do ângulo
formado pelos vetores:
(a) ~u e −~v (b) −~u e 2~v (c) −~u e −~v (d) 3~u e 5~v
Temos:
(a) O ângulo entre ~v e −~v mede 180◦, pois esses vetores possuem mesma direção porém sentidos opostos. Logo, o
ângulo entre ~u e −~v é suplementar do ângulo entre ~u e ~v.
Sabemos que o ângulo entre ~u e ~v mede 60◦, então o ângulo entre ~u e −~v mede 180◦ − 60◦ = 120◦.
v
ua = 60
o
b = 120o
-v
-u
(b) O ângulo entre −~u e 2~v é o mesmo de −~u e ~v, que é suplementar do ângulo entre ~u e ~v. Portanto, o ângulo entre
−~u e 2~v mede 120◦.
(c) O ângulo entre −~u e −~v é o mesmo de ~u e ~v (opostos pelo vértice). Portanto, o ângulo entre −~u e −~v mede 60◦.
(d) O ângulo entre 3~u e 5~v é o mesmo de ~u e ~v,(opostos pelo vértice). Portanto, o ângulo entre 3~u e 5~v mede 60◦.
2.2 Vetores: abordagem algébrica
2.2.1 Coordenadas na Reta
No ińıcio deste caṕıtulo fixamos uma unidade de comprimento para que pudéssemos falar de comprimento de
segmentos e, portanto, de comprimento de vetores. Fixar ou definir uma unidade de comprimento equivale a admitir
a existência de uma noção de distância(2) entre dois pontos de uma reta. É precisamente a noção de distância que
permite a introdução de coordenadas na reta, ou seja, a distância permite associar pontos da reta a números (e vice-
versa). Já falamos sobre isso de maneira simplificada na Seção 1.1 do Caṕıtulo 1, quando introduzimos o conjunto R
dos números reais. Agora, vejamos como introduzir coordenadas na reta de um modo um pouco mais rigoroso, por
meio das definições abaixo.
Assumamos uma unidade de comprimento fixada. Dados dois pontos A e B sobre uma reta r, definimos a
distância entre A e B como sendo o comprimento do segmento de reta AB, e indicamos por d (A,B).
A
B
d A
B
( ,
)
Uma reta r se diz orientada quando sobre ela se estabelece um sentido de percurso, dito positivo. O sentido
de percurso contrário é dito negativo.
Dada uma reta r orientada e dois pontos A,B ∈ r dizemos que A está à esquerda de B (ou que B está à direita
de A) quando o sentido de percurso de A para B é positivo.(3)
sentido de percurso positivo ( )+
( )- sentido de percurso negativo
r
A B
Uma reta orientada na qual se fixou um ponto O, dito origem, é chamada de eixo.
r
O +-
Vamos estabelecer uma bijeção(4) entre o conjunto dos números reais e um eixo do seguinte modo:
2Em Matemática, distância ou métrica em um conjunto S é uma função d : S×S → R, indicada por d (X, Y), que associa dois elementos
X e Y de S a um número real d = d (X, Y), cumprindo as seguintes condições:
(i) d (X, Y) > 0 e d (X, Y) = 0⇐⇒ X = Y;
(ii) d (X, Y) = d (Y, X) (simetria);
(iii) d (X, Y) > d (X, Z) + d (Z, Y), ∀Z ∈ S (desigualdade triangular).
3Nesta definição é conveniente pensar na reta r na posição horizontal com o sentido positivo para o lado direito.
4Uma bijeção ϕ : R → r é uma regra que associa (ou faz corresponder) cada número real do conjunto R a um único ponto da reta r,
satisfazendo dois quesitos:
(i) números reais distintos do conjunto R estão associados a pontos distintos da reta r (injetividade).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 24 de 157 páginas UFU GAAL
Sejam r um eixo, com origem O, e R conjunto dos números reais.
À origem X = O fazemos corresponder o número x = 0;
A um ponto X ∈ r à direita de O fazemos corresponder o número x = d (O,X);
A um ponto X ∈ r à esquerda de O fazemos corresponder o número x = −d (X,O).
Reciprocamente:
Ao número x = 0 fazemos corresponder a origem X = O;
A um número real x ∈ R+ fazemos corresponder o ponto X ∈ r à direita de O tal que d (O,X) = x;
A um número real x ∈ R− fazemos corresponder o ponto X ∈ r à esquerda de O tal que −d (X,O) = x;
0 x
O X
R
r+
=x d O X( , )
-
x 0
X O
R
r+
x d X O= - ( , )
-
O número x ∈ R associado ao ponto X ∈ r, conforme descrito acima, é chamado de coordenada do ponto X no
eixo r.
O eixo r associado ao conjunto R, conforme descrito acima, é chamado de eixo coordenado, ou eixo real, ou
reta real.
0 1 2 3-1-2-3
O P
R
r- +
É comum representar um eixo coordenado na posição horizontal com sentido de percurso positivo da esquerda para
a direita.
Embora seja muito intuitiva, a definição de eixo coordenado dada acima é um tanto longa (às vezes, em matemática,
as coisas mais simples e intuitivas são dif́ıceis de serem justificadas). Por isso, é comum sacrificar um pouco o rigor da
linguagem matemática e dizer que um eixo coordenado é, simplesmente, uma reta associada ao conjunto dos números
reais na qual foi fixada a unidade de medida.
Por fim, a proposição abaixo fornece a distância entre dois pontos sobre um eixo coordenado utilizando suas
coordenadas. Sua demonstração pode ser encontrada na referência [4].
Proposição 2.4 Se X e Y são pontos de um eixo coordenado, então
d (X, Y) = |x− y| ,
sendo x a coordenada de X e y a coordenada de Y.
2.2.2 Coordenadas no Plano
A definição de eixo coordenado dada acima é útil para definirmos um sistema de coordenadas cartesianas ortogonais
no plano. Já apresentamos essa definição na Seção 1.2 do Caṕıtulo 1, mas vamos repet́ı-la abaixo:
Consideremos dois eixos coordenados congruentes (isto é, segmentos unitários são congruentes em cada um dos
eixos) perpendiculares e com origens coincidentes no ponto O.
Um dos eixos coordenados será chamado de eixo das abscissas, indicado por Ox, enquanto que o outro será
chamado de eixo das ordenadas, indicado por Oy.
Um plano determinado por dois eixos coordenados, conforme descrito acima, será dito um plano munido de
um sistema de coordenadas cartesianas ortogonais ou, simplificadamente, plano cartesiano, indicado por
Oxy.
O ponto O é chamado de origem do sistema de coordenadas cartesianas ortogonais.
É comum representar o plano cartesiano com o eixo Ox na horizontal com a orientação (sentido de percurso) da
esquerda para a direita e o eixo Oy na vertical com orientação debaixo para cima.
(ii) qualquer ponto da reta r está associado a algum número real de R (sobrejetividade).
Pergunta: O que a bijeção ϕ tem de importante?
Resposta: Unicidade de associação!
Ou seja, todos os números reais de R estão associados de forma uńıvoca a todos os pontos da reta r e vice-versa.
Em outras palavras: não há ponto da reta r associado a mais do que um único número real de R e; não há número real de R associado
a mais do que um único ponto da reta r.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 25 de 157 páginas
0 1 2 3-1-2-3 x
-1
-2
-3
1
2
3
y
O ( )origem
Oy: eixo das ordenadas
Ox: eixo das abscissas
+
+
-
-
A grande utilidade do plano cartesiano está no fato de cada ponto deste plano estar associado a um par ordenado
de números reais e vice-versa. Esta associação é feita do seguinte modo:
• (1) Dado um ponto P no plano cartesiano, consideremos as projeções ortogonais desse ponto nos eixos coordena-
dos(5). A projeção ortogonal Px de P no eixo coordenado Ox é um ponto de coordenada x neste eixo, que chamamos
de abscissa de P, enquanto que a projeção ortogonal Py de P no eixo Oy é um ponto de coordenada y neste eixo,
que chamamos de ordenada de P. Abscissas e ordenadas são chamadas, também, de coordenadas cartesianas
de P. O ponto P fica, portanto, associado ao par ordenado de números reais (x, y). Indicamos essa associação por
P = (x, y) ou P (x, y) .
Observemos que devido às unicidades das projeções ortogonais de P nos eixos coordenados, o par ordenado (x, y)
é único!
P
x
y
Px
Py
0 x
y
P x y® ( , )
• (2) Dado um par ordenado de números reais (x, y), tomamos os pontos Px e Py, de coordenadas x e y nos eixos
Ox e Oy, respectivamente. Por Px traçamos a perpendicular ao eixo Ox e por Py traçamos a perpendicular ao eixo
Oy. O cruzamento dessas perpendiculares determina um ponto P. O par ordenado de números reais (x, y) fica,
portanto, associado ao ponto P.
Mais uma vez, devido às unicidades de Px e Py (e das perpendiculares), P é o único ponto que pode ser associado
ao par ordenado (x, y).
P
x
y
Px
Py
0 x
y
( , )x y P®
Os eixos coordenados Ox e Oy dividem o plano cartesiano em quatro regiões, chamadas de quadrantes. Os
pontos P (x, y) tais que:
• x, y > 0, estão no chamado 1 o quadrante do plano cartesiano;
• x < 0 e y > 0, estão no chamado 2 o quadrante do plano cartesiano;
• x, y < 0, estão no chamado 3o quadrante do plano cartesiano;
• x > 0 e y < 0, estão no chamado 4 o quadrante do plano cartesiano.
5As projeções ortogonais de um ponto P nos eixos coordenados são os pés das perpendiculares baixadas de P aos eixos coordenados.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 26 de 157 páginas UFU GAAL
P x y( , )
x
y
1o. quadrante2o. quadrante
3o. quadrante 4o. quadrante
0 x
y
O conjunto dos pares ordenados de números reais é indicado por R2, ou seja:
R2 = {(x, y) : x, y ∈ R}
A associação entre pontos do plano cartesiano e pares ordenados de números reais R2 descrita em (1) e (2) acima
permite que se diga que existe uma bijeção entre o plano cartesiano e R2. É por isso que alguns textos referem-se ao
conjunto R2 como “plano cartesiano”.
Por fim, uma observação simples, porém importante e útil na resolução de exerćıcios, diz respeito a igualdade de
pares ordenados:
(x1, y1) = (x2, y2)⇐⇒ { x1 = x2y1 = y2 .
2.2.3 Vetores no Plano Cartesiano
Embora estejamos trabalhando com vetores no espaço. Podemos fazer uma restrição e considerar apenas os vetores
que possuam representantes contidos em um determinado plano. Um tal conjunto de vetores costuma ser denotado
por V2. Para simplificar, iremos chamá-los de “vetores no plano”.
Todo vetor em um plano pode ser associado a um único par ordenado, e vice-versa, do seguinte modo:
Fixemos um sistema de coordenadas cartesianas ortogonais Oxy, com origem O, no plano. Dado um vetor ~v
neste plano cartesiano, tomemos um representante de ~v com origem O e extremo P (x, y), ou seja, ~v =
−→
OP.
O par ordenado (x, y), associado ao ponto P está, também, associado ao vetor ~v, e escrevemos ~v = (x, y).
Assim como já introduzido para os pontos P, x é chamado de abscissa de ~v e y é chamado de ordenada de ~v.
Abscissas e ordenadas são chamadas, também, de coordenadas cartesianas de ~v.
O x
y
x
y
P x y( , )
v
v
v OP= = ( , )x y
Observemos que as coordenadas de um vetor são as coordenadas de seu extremo, desde que a origem do vetor
esteja na origem do sistema de coordenadas.
Vamos introduzir, na próxima definição, dois vetores que desempenharão um papel muito importante no estudo
algébrico dos vetores no plano cartesiano.
Fixemos um sistema de coordenadas cartesianas ortogonais Oxy no plano. Consideremos os vetores ~i = (1, 0) e
~j = (0, 1). O conjunto B = {~i,~j} é chamado de base canônica do plano cartesiano.
A próxima proposição relaciona coordenadas de vetores com a base canônica introduzida acima.
Proposição 2.5 Consideremos um sistema de coordenadas cartesianas ortogonais Oxy no plano com a base canônica
B = {~i,~j} fixada. Para os vetores ~v desse plano cartesiano temos
~v = (x, y)⇐⇒ ~v = x~i+ y~j .
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 27 de 157 páginas
Demonstração da Proposição 2.5.
(⇒) Façamos ~v = −→OP = (x, y), sendo O a origem do plano cartesiano. Logo, P (x, y) é tal que x é a coordenada da
projeção ortogonal Px do ponto P no eixo Ox, e y é a coordenada da projeção ortogonal Py do ponto P no eixo Oy.
• Se x > 0 temos x = d (O,Px) e temos o ponto Px à direita de O. Com isto, os vetores x~i e
−−→
OPx possuem o mesmo
comprimento, direção e sentido, ou seja, são iguais.
• Se x = 0 temos Px = O e, mais uma vez, x~i e
−−→
OPx são iguais ao vetor nulo.
• Se x < 0 temos x = −d (Px, O) e temos o ponto Px à esquerda de O. Com isto, de novo, os vetores x~i e
−−→
OPx
possuem o mesmo comprimento, direção e sentido, ou seja, são iguais.
Naturalmente a mesma análise pode ser feita com o y. Logo, temos{
x~i =
−−→
OPx
y~j =
−−→
OPy
.
Como
−→
OP =
−−→
OPx +
−−→
OPy. conclúımos que ~v = x~i+ y~j.
(⇐) Façamos x~i = −−→OA.
• Se x > 0 temos A à direita de O e a coordenada de A no eixo Ox é d (O,A) = ||
−−→
OA|| = ||x~i|| = |x|.||~i|| = x.1 = x.
• Se x = 0 temos A = O e a coordenada de A no eixo Ox é 0.
• Se x < 0 temos A à esquerda de O e a coordenada de A no eixo Ox é −d (A,O) = −||
−−→
OA|| = −||x~i|| = −|x|.||~i|| =
−(−x) .1 = x.
Desta forma, a coordenada de A no eixo Ox é x em qualquer caso.
De forma análoga, fazendo y~j =
−→
OB, a coordenada de B no eixo Oy é y.
Traçando-se as perpendiculares aos eixos coordenados pelos pontos A e B encontramos o ponto P de coordenadas
(x, y). Desta forma, temos
−→
OP = (x, y).
Mas
−−→
OA+
−→
OB =
−→
OP ⇒ x~i+y~j = −→OP ⇒ ~v = −→OP (pois, por hipótese, ~v = x~i+y~j)⇒ ~v = (x, y), como queŕıamos.�
Observemos que, devido à unicidade do par ordenado associado a ~v, então ~v = x~i + y~j também é escrito de modo
único para cada vetor ~v.
Uma soma do tipo x~i + y~j é chamada de combinação linear dos vetores ~i e ~j. Assim, dizemos que ~v = x~i + y~j
está escrito como combinação linear dos vetores da base canônica do plano cartesiano.
0
i
j
x
y
O
xi
yj
x
y P x y( , )
v
1
1
x
y
v OP= = ( , ) =x y xi yj+
Alguns casos particulares interessantes:
• O vetor nulo é da forma ~0 = (0, 0);
• Vetores paralelos ao eixo das abscissas possuem ordenadas nulas, ou seja, são da forma ~v = (x, 0). Se x > 0, então ~v
e ~i possuem o mesmo sentido. Se x < 0, então ~v e ~i possuem sentidos opostos.
• Vetores paralelos ao eixo das ordenadas possuem abscissas nulas, ou seja, são da forma ~v = (0, y). Se y > 0, então
~v e ~j possuem o mesmo sentido. Se y < 0, então~v e ~j possuem sentidos opostos.
A Proposição 2.5 acima, além de estabelecer uma conexão entre pares ordenados e a base canônica do plano
cartesiano, também permite deduzir como ficam as operações de adição e multiplicação por escalar em termos de
coordenadas, bem como algumas propriedades algébricas bastante úteis envolvendo vetores. Esse é o conteúdo da
próxima proposição.
Proposição 2.6 (Propriedades) Fixemos um sistema de coordenadas cartesianas ortogonais Oxy no plano com base
canônica B = {~i,~j}.
• (1) (Operações) Se ~u = (x1, y1) e ~v = (x2, y2), então ~u+~v = (x1 + x2, y1 + y2).
Se α ∈ R e ~v = (x, y), então α~v = (αx, αy).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 28 de 157 páginas UFU GAAL
0
x
y
x1 x2 x x1 2+
y1
y2
y y1 2+
v
u
u v+
0
x
y
v
av
x ax
y
ay
(a > )0
Consequentemente, todas as propriedades de adição de vetores e multiplicação de vetor por escalar valem para pares
ordenados de números reais.
Observação: as operações de adição de pares ordenados e multiplicação de par ordenado por escalar expostas acima são
chamadas de operações usuais em R2.
• (2) (Condição de paralelismo) Os vetores ~u = (x1, y1) e ~v = (x2, y2), sendo ~v 6= ~0, são paralelos se, e somente se,
existe α ∈ R tal que x1 = αx2 e y1 = αy2, ou seja, (x1, y1) = α (x2, y2).
• (3) (Vetor definido por dois pontos) Se A (x1, y1) e B (x2, y2), então ~v =
−→
AB = (x2 − x1, y2 − y1). Por esse
motivo, é comum escrevermos ~v = B−A, ou B = A+~v. (figura abaixo à esquerda)
• (4) (Ponto médio) Se A (x1, y1) e B (x2, y2), então as coordenadas do ponto médio M do segmento AB é
M
(
x1+x2
2
, y1+y2
2
)
. (figura abaixo ao centro)
• (5) (Módulo) Se ~v = (x, y), então ||~v|| =
√
x2 + y2. (figura abaixo à direita)
0
x
y
x2x1
y2
y1
v
0
x
y
x x2 1-
y y2 1-
v A
B
x1 x2
y2
y y1 2+
2
x x1 2+
2
B
A
M
0
x
y
x
y
v
| |y
| |x
y1
|| ||v
Demonstração da Proposição 2.6.
• (1) Consideremos a base canônica B = {~i,~j} no plano cartesiano e a Proposição 2.5.
(a) Adição:
Se ~u = (x1, y1) e ~v = (x2, y2), então{
~u = (x1, y1)
~v = (x2, y2)
⇒
∗
{
~u = x1~i+ y1~j
~v = x2~i+ y2~j
⇒ ~u+~v = Äx1~i+ y1~jä+ Äx2~i+ y2~jä⇒
~u+~v =
Ä
x1~i+ x2~i
ä
+
Ä
y1~j+ y2~j
ä⇒ ~u+~v = (x1 + x2)~i+ (y1 + y2)~j⇒∗
~u+~v = (x1 + x2, y1 + y2) .
(b) Multiplicação por escalar:
Se α ∈ R e ~v = (x, y), então
α~v = α (x, y)⇒
∗
α~v = α
Ä
x~i+ y~j
ä
= (αx)~i+ (αy)~j⇒
∗
α~v = (αx, αy) .
Nas passagens indicadas com (∗) utilizamos a Proposição 2.5.
• (2) (⇒) Se ~u = (x1, y1) e ~v = (x2, y2), com ~v 6= ~0, são paralelos, então, pela Proposição 2.3, existe α ∈ R tal que
~u = α~v.
Logo, (x1, y1) = α (x2, y2). Pelo item (1) acima: (x1, y1) = (αx2, αy2) e, portanto, x1 = αx2 e y1 = αy2.
(⇐) Se existe α ∈ R tal que x1 = αx2 e y1 = αy2, então (x1, y1) = α (x2, y2) e, portanto, ~u = α~v. Pela
Proposição 2.3 temos ~u//~v.
• (3) Sendo O a origem do sistema de coordenadas, A (x1, y1) e B (x2, y2); consideremos os vetores
−−→
OA = (x1, y1)
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 29 de 157 páginas
e
−→
OB = (x2, y2) (figura abaixo à esquerda). Logo, utilizando o Item (1) acima:
~v =
−→
AB =
−−→
AO+
−→
OB =
−→
OB−
−−→
OA =
−→
OB+ (−1)
−−→
OA = (x2, y2) + (−1) (x1, y1) = (x2, y2) + (−x1,−y1)⇒
~v = (x2 − x1, y2 − y1) .
O
x
y
x2x1
y2
y1
v
0
x
y
A
B
x1 x2
y2 B
A
M
O
x
y
x
y
v
| |y
| |x
y1
|| ||v
x
y
Py
Px
P
• (4) Seja M (x, y) as coordenadas do ponto médio do segmento AB, sendo A (x1, y1) e B (x2, y2). Logo,
−−→
AM e
−−→
MB
são vetores de mesmo comprimento, direção e sentido, ou seja, são iguais (figura acima ao centro). Mas, de acordo
com o Item (3): { −−→
AM =M−A = (x, y) − (x1, y1) = (x− x1, y− y1)−−→
MB = B−M = (x2, y2) − (x, y) = (x2 − x, y2 − y)
.
Da igualdade
−−→
AM =
−−→
MB temos:
(x− x1, y− y1) = (x2 − x, y2 − y)⇒ { x− x1 = x2 − xy− y1 = y2 − y ⇒
{
2x = x1 + x2
2y = y21 + y2
⇒M (x, y) = M (x1+x2
2
, y1+y2
2
)
.
• (5) Sendo O a origem do sistema de coordenadas.
(a) É claro que se ~v = ~0, então o resultado é verdadeiro.
(b) Se ~v =
−→
OP = (x, y) é tal que y = 0 e x 6= 0, então P está sobre o eixo Ox e sua coordenada neste eixo é
x. Então, x = d (O,P), se P estiver à direita de O e x = −d (P,O), se x estiver à esquerda de O. Isto significa que
||
−→
OP|| = |x| em ambos os casos. Portanto, ||~v|| = ||
−→
OP|| = |x| =
√
x2 + 02.
(c) Se ~v =
−→
OP = (x, y) é tal que x = 0 e y 6= 0, então racioćınio análogo nos conduz a ||~v|| =
√
02 + y2.
(d) Se ~v =
−→
OP = (x, y) é tal que x 6= 0 e y 6= 0, então consideremos os pontos Px e Py projeções ortogonais de
P (x, y) nos eixos Ox e Oy, respectivamente. Logo, as coordenadas de Px e Py nos seus respectivos eixos são x e y
(figura acima à direita). Portanto, {
||
−−→
OPx|| = |x|
||
−−→
OPy|| = |y|
,
de acordo com o racioćınio que fizemos em (b) acima.
Porém, OPxPPy é um retângulo. Portanto,
−−→
OPy =
−−→
PxP, e temos
||
−−→
PxP|| = |y|.
Por fim, observemos que OPxP é um triângulo retângulo com OP hipotenusa, OPx e PxP catetos. Logo, a
hipotenusa mede ||
−→
OP|| = ||~v|| e os catetos medem ||
−−→
OPx|| = |x| e ||
−−→
PxP|| = |y|. Portanto, pelo Teorema de Pitágoras:
||~v|| =
»
|x|2 + |y|2 ⇒ ||~v|| =√x2 + y2 ,
como queŕıamos. �
Observação: No plano, as operações de adição de vetores e multiplicação de vetor por escalar, que introduzimos na
Seção 2.1, são equivalentes às chamadas operações usuais de adição de pares ordenados e multiplicação de par ordenado
por escalar, conforme apresentadas no Item (1) da Proposição 2.6 acima. Da forma como estamos desenvolvendo a
teoria até aqui, dá-se a impressão de que as operações usuais de pares ordenados “vieram depois” das suas análogas
com vetores, quando, na verdade, ocorreu o contrário. Afinal, devido a sua simplicidade, é bem mais natural começar
com as operações usuais de pares ordenados do que com as operações geométricas de vetores como, por exemplo, a
adição de vetores, que pode soar um pouco estranha à primeira vista... As definições geométricas das operações com
vetores no plano foram pensadas exatamente para serem compat́ıveis com as operações usuais com pares ordenados.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 30 de 157 páginas UFU GAAL
A mesma observação também ocorre com vetores no espaço, conforme poderemos constatar nas próximas subseções.
Exemplo 2.9 Dados os vetores no plano ~u = (2,−4), ~v = (−5, 1) e ~w = (−12, 6), determinemos a1 e a2 tais que
~w = a1~u+ a2~v.
Temos:
~w = a1~u+ a2~v = (−12, 6) = a1 (2,−4) + a2 (−5, 1)⇒ (−12, 6) = (2a1 − 5a2,−4a1 + a2)⇒{
2a1 − 5a2 = −12
− 4a1 + a2 = 6
⇒ · · ·⇒ a1 = −1 e a2 = 2 .
Exemplo 2.10 Determinemos, no plano, as coordenadas do ponto inicial do segmento orientado que representa o
vetor ~v = (−1, 3), sabendo que sua extremidade está no ponto (3, 1).
Seja A a origem de ~v e B (3, 1) seu extremo. Chamemos A (x, y). Logo,
~v =
−→
AB = B−A = (3, 1) − (x, y) = (3− x, 1− y)⇒
(−1, 3) = (3− x, 1− y)⇒ { 3− x = −1
1− y = 3
⇒ (x, y) = (4,−2) .
Portanto, A (4,−2) é origem de ~v.
0 3-1 x
-2
3
y
v
4
1
A
Bv
Exemplo 2.11 Calculemos os valores de a para que o vetor −→u = (a, 1
2
)
seja unitário.
Temos:
||~u|| = 1⇒√a2 + (1
2
)2
= 1⇒ a2 + 1
4
= 12 ⇒ a2 = 3
4
⇒ a = ±√3
2
.
2.2.4 Coordenadas no Espaço
De forma análoga ao plano, podemos definir um sistema de coordenadas cartesianas ortogonais no espaço. O
que vamos fazer a seguir é, basicamente, copiar a teoria apresentada na Subseção 2.2.2 (Coordenadas no Plano)
acrescentando mais um eixo coordenado. Vejamos:
Consideremos três eixos coordenados congruentes, perpendiculares dois a dois e com origens coincidentes no
ponto O.
Um dos eixos coordenados será chamadode eixo das abscissas, indicado por Ox, um outro será chamado de
eixo das ordenadas, indicado por Oy, enquanto que o último será chamado de eixo das cotas, indicado por Oz.
Considerando os três eixos, conforme descrito acima, dizemos que o espaço está munido de um sistema de
coordenadas cartesianas ortogonais ou, simplificadamente, espaço cartesiano, indicado por Oxyz.
O ponto O é chamado de origem do sistema de coordenadas cartesianas ortogonais.
É comum representar o espaço cartesiano como o plano cartesiano Oxy na horizontal e o eixo Oz na vertical com
orientação de baixo para cima. A posição relativa dos três eixos coordenados no espaço geralmente é definida de
tal modo que as orientações dos eixos respeitem as indicações naturais dos dedos indicador, médio e polegar da mão
direita. Em outras palavras, se os eixos Ox, Oy e Oz forem determinados pelos dedos indicador, médio e polegar da
mão direita, então as orientações desses eixos respeitam as indicações naturais desses dedos. A figura abaixo ilustra
os eixos coordenados na posição que estamos estabelecendo.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 31 de 157 páginas
y
z
x
plano cartesiano Oxy
O ( )origem
Ox: eixo das abscissas
Oy: eixo das ordenadas
Oz: eixo das cotas
+
+
+
A grande utilidade do plano cartesiano está no fato de cada ponto deste plano estar associado a uma terna (ou
tripla) ordenada de números reais e vice-versa. Esta associação é feita do seguinte modo:
• (1) Dado um ponto P no espaço cartesiano, consideremos as projeções ortogonais desse ponto nos eixos coordena-
dos. A projeção ortogonal Px de P no eixo Ox é um ponto de coordenada x neste eixo, que chamamos de abscissa
de P; a projeção ortogonal Py de P no eixo Oy é um ponto de coordenada y neste eixo, que chamamos de ordenada
de P; enquanto que a projeção ortogonal Pz de P no eixo Oz é um ponto de coordenada z neste eixo, que chamamos
de cota de P. Abscissas, ordenadas e cotas são chamadas, também, de coordenadas cartesianas de P. O ponto
P fica, portanto, associado à terna ordenada de números reais (x, y, z). Indicamos essa associação por
P = (x, y, z) ou P (x, y, z) .
Assim como no plano cartesiano, devido às unicidades das projeções ortogonais de P nos eixos coordenados, a terna
ordenada (x, y, z) é única.
y
z
x
O
P
Py
y
Px
x
Pzz
P x y z( , , )®
• (2) Dada uma terna ordenada de números reais (x, y, z), tomamos os pontos Px, Py e Pz, de coordenadas x, y e
z nos eixos Ox, Oy e Oz, respectivamente. Por Px traçamos o plano perpendicular ao eixo Ox, por Py traçamos
o plano perpendicular ao eixo Oy e, por Pz traçamos o plano perpendicular ao eixo Oz. A intersecção desses três
planos perpendiculares aos eixos determina um único ponto P. A terna ordenada de números reais (x, y, z) fica,
portanto, associada a este ponto P.
Mais uma vez, devido às unicidades de Px, Py e Pz nos eixos (e dos planos perpendiculares constrúıdos), o ponto
P é o único ponto que pode ser associado à terna ordenada (x, y, z).
y
z
y
z
x
Px
x
x
O
y
z
Py
x
O y
z
Pz
O y
z
x
O
P
Py
y
Px
x
Pzz
( , , )x y z P®
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 32 de 157 páginas UFU GAAL
Os eixos coordenados Ox, Oy e Oz determinam três planos cartesianos Oxy, Oxz e Oyz que devidem o espaço
em oito regiões, chamadas de octantes. Os pontos P (x, y, z) tais que:
• x, y, z > 0, estão no chamado 1 o octante do espaço cartesiano;
• x < 0 e y, z > 0, estão no chamado 2 o octante do espaço cartesiano;
• x, y < 0 e z > 0, estão no chamado 3o octante do espaço cartesiano;
• x, z > 0 e y < 0, estão no chamado 4 o octante do espaço cartesiano;
• x, y > 0 e z < 0, estão no chamado 5 o octante do espaço cartesiano;
• x, z < 0 e y > 0, estão no chamado 6 o octante do espaço cartesiano;
• x, y, z < 0, estão no chamado 7o octante do espaço cartesiano;
• x > 0 e y, z < 0, estão no chamado 8 o octante do espaço cartesiano.
y
x
z
O
1o. octante
2o. octante
5o. octante
6o. octante7o. octante
8o. octante
3o. octante
4o. octante
O conjunto das ternas ordenadas de números reais é indicado por R3, ou seja:
R3 = {(x, y, z) : x, y, z ∈ R}
A associação entre pontos do espaço cartesiano e ternas ordenadas de números reais R3 descrita em (1) e (2) acima
permite que se diga que existe uma bijeção entre o espaço cartesiano e R3. É por isso que alguns textos referem-se
ao conjunto R3 como “espaço cartesiano”.
E ainda, de forma análoga aos pares ordenados, uma observação sobre igualdade de ternas ordenadas:
(x1, y1, z1) = (x2, y2, z2)⇐⇒
 x1 = x2y1 = y2
z1 = z2
.
2.2.5 Vetores no Espaço Cartesiano
Mais uma vez, o que vamos fazer a seguir é, basicamente, copiar a teoria apresentada na Subseção 2.2.3 (Vetores
no Plano Cartesiano) acrescentando mais um eixo coordenado. Sendo assim, todo vetor no espaço pode ser associado
a uma única terna ordenada e vice-versa do seguinte modo:
Fixemos um sistema de coordenadas cartesianas ortogonais Oxyz, com origem O, no espaço. Dado um vetor ~v
neste espaço cartesiano, tomemos um representante de ~v com origem O e extremo P (x, y, z), ou seja, ~v =
−→
OP.
A terna ordenada (x, y, z), associada ao ponto P está, também, associada ao vetor ~v, e escrevemos ~v = (x, y, z).
Assim como já introduzido para os pontos P, x é chamado de abscissa de ~v, y é chamado de ordenada de ~v
e z é chamado de cota de ~v. Abscissas, ordenadas e cotas são chamadas, também, de coordenadas cartesianas
de ~v.
y
z
x
O
P( , , )x y z
y
x
z
v
v
v OP= = ( , )x y,z
Observemos que as coordenadas de um vetor são as coordenadas de seu extremo, desde que a origem do vetor
esteja na origem do sistema de coordenadas.
Vamos introduzir, na próxima definição, três vetores que desempenharão um papel muito importante no estudo
algébrico dos vetores no espaço cartesiano.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 33 de 157 páginas
Fixemos um sistema de coordenadas cartesianas ortogonais Oxyz no espaço. Consideremos os vetores ~i =
(1, 0, 0), ~j = (0, 1, 0) e ~k = (0, 0, 1). O conjunto B = {~i,~j,~k} é chamado de base canônica do espaço cartesiano.
A próxima proposição relaciona coordenadas de vetores com a base canônica introduzida acima. Sua demonstração
segue os mesmos passos da Proposição 2.5 e será deixada como exerćıcio.
Proposição 2.7 Consideremos um sistema de coordenadas cartesianas ortogonis Oxyz no espaço com a base canônica
B = {~i,~j,~k} fixada. Para os vetores ~v do espaço cartesiano temos
~v = (x, y, z)⇐⇒ ~v = x~i+ y~j+ z~k .
Observemos que, devido à unicidade da terna ordenada associada a ~v, então ~v = x~i + y~j + z~k também é escrito
de modo único para cada vetor ~v. Observemos, também, que os vetores da base canônica satisfazem a “regra da mão
direita”, já apresentada.
Uma soma do tipo x~i + y~j + z~k é chamada de combinação linear dos vetores ~i, ~j e ~k. Assim, dizemos que
~v = x~i+ y~j+ z~k está escrito como combinação linear dos vetores da base canônica do espaço cartesiano.
y
z
x
O
P( , , )x y z
y
x
z
v
v OP= = ( , )x y, = + +z xi yj zk
zk
yj
xi
y
z
x
0
1
k
j
i
1
1
Alguns casos particulares interessantes:
• O vetor nulo é da forma ~0 = (0, 0, 0);
• Vetores paralelos ao eixo das abscissas possuem ordenadas e cotas nulas, ou seja, são da forma ~v = (x, 0, 0). Se
x > 0, então ~v e ~i possuem o mesmo sentido. Se x < 0, então ~v e ~i possuem sentidos opostos.
• Vetores paralelos ao eixo das ordenadas possuem abscissas e cotas nulas, ou seja, são da forma ~v = (0, y, 0). Se
y > 0, então ~v e ~j possuem o mesmo sentido. Se y < 0, então ~v e ~j possuem sentidos opostos.
• Vetores paralelos ao eixo das cotas possuem abscissase ordenadas nulas, ou seja, são da forma ~v = (0, 0, z). Se z > 0,
então ~v e ~k possuem o mesmo sentido. Se z < 0, então ~v e ~k possuem sentidos opostos.
• Os eixos Ox, Oy e Oz determinam três planos cartesianos no espaço. Os pontos P do plano Oxy, quando considerados
pontos do espaço, estão associados a três coordenadas tais que P (x, y, 0). Analogamente, os pontos dos planos
cartesianos Oxz e Oyz são da forma P (x, 0, z) e P (0, y, z), respectivamente.
A Proposição 2.7 acima, além de estabelecer uma conexão entre ternas ordenadas e a base canônica do espaço
cartesiano, também permite deduzir como ficam as operações de adição e multiplicação por escalar em termos de
coordenadas, bem como algumas propriedades algébricas bastante úteis envolvendo vetores. Esse é o conteúdo da
próxima proposição, cuja demonstração é bastante similar àquela feita na Proposição 2.6 e será, também, deixada
como exerćıcio.
Proposição 2.8 (Propriedades) Fixemos um sistema de coordenadas cartesianas ortogonais Oxyz no espaço com base
canônica B = {~i,~j,~k}.
• (1) (Operações) Se ~u = (x1, y1, z1) e ~v = (x2, y2, z2), então ~u+~v = (x1 + x2, y1 + y2, z1 + z2).
Se α ∈ R e ~v = (x, y, z), então α~v = (αx, αy, αz).
Consequentemente, todas as propriedades de adição de vetores e multiplicação de vetor por escalar valem para ternas
ordenadas de números reais.
Observação: as operações de adição de ternas ordenadas e multiplicação de terna ordenada por escalar expostas acima
são chamadas de operações usuais em R3.
• (2) (Condição de paralelismo) Os vetores ~u = (x1, y1, z1) e ~v = (x2, y2, z2), sendo ~v 6= ~0, são paralelos se, e somente
se, existe α ∈ R tal que x1 = αx2, y1 = αy2 e z1 = αz2 ou seja, (x1, y1, z1) = α (x2, y2, z2).
• (3) (Vetor definido por dois pontos) Se A (x1, y1, z1) e B (x2, y2, z2), então ~v =
−→
AB = (x2 − x1, y2 − y1, z2 − z1).
Por esse motivo, é comum escrevermos ~v = B−A, ou B = A+~v.
• (4) (Ponto médio) Se A (x1, y1, z1) e B (x2, y2, z2), então as coordenadas do ponto médio M do segmento AB é
M
(
x1+x2
2
, y1+y2
2
, z1+z2
2
)
.
• (5) (Módulo) Se ~v = (x, y, z), então ||~v|| =
√
x2 + y2 + z2.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 34 de 157 páginas UFU GAAL
Exemplo 2.12 Dados os pontos A (3,−4,−2) e B (−2, 1, 0), determinemos o ponto N pertencente ao segmento AB
tal que
−−→
AN = 2
5
−→
AB.
Temos
−→
AB = B−A = (−2, 1, 0) − (3,−4,−2) = (−5, 5, 2).
Façamos N (x, y, z). Logo,
−−→
AN = N−A = (x, y, z) − (3,−4,−2) = (x− 3, y+ 4, z+ 2).
Desta forma:
−−→
AN = 2
5
−→
AB⇒ (x− 3, y+ 4, z+ 2) = 2
5
(−5, 5, 2)⇒ (x− 3, y+ 4, z+ 2) = (−2, 2, 4
5
)⇒ x− 3 = −2y+ 4 = 2
z+ 2 = 4/5
⇒ x = 1, y = −2 e z = −6
5
.
Logo, N
(
1,−2,−6
5
)
.
Exemplo 2.13 Determinemos os três vértices de um triângulo, sabendo que os pontos médios de seus lados são
M (5, 0,−2), N (3, 1,−3) e P (4, 2, 1).
Chamemos o triângulo de ABC sendo M, N e P pontos médios de CA, BC e AB, respectivamente.
Aqui é conveniente lembrar o Exemplo 2.7, página 21, que afirma que o segmento que liga os pontos médios de
dois lados de um triângulo é paralelo ao terceiro lado e mede a metade de seu comprimento.
Isto significa que, considerando os vetores representados na figura abaixo,
A B
N
C
M
P
temos:
−−→
MN =
−→
PB
−−→
PM =
−→
NC
−→
NP =
−−→
MA
⇒
 N−M = B− PM− P = C−N
P −N = A−M
⇒
 (3, 1,−3) − (5, 0,−2) = B− (4, 2, 1)(5, 0,−2) − (4, 2, 1) = C− (3, 1,−3)
(4, 2, 1) − (3, 1,−3) = A− (5, 0,−2)
⇒
 B = (2, 3, 0)C = (4,−1,−6)
A = (6, 1, 2)
.
Exemplo 2.14 Calculemos as coordenadas do ponto P, no eixo das abscissas, que seja equidistante dos pontos
A (3,−1, 4) e B (1,−2,−3).
Façamos P (x, y, z). Como P está no eixo das abscissas (eixo Ox), temos y = z = 0, ou seja, P (x, 0, 0).
Desta forma, temos { −→
PA = A− P = (3,−1, 4) − (x, 0, 0) = (3− x,−1, 4)
−→
PB = B− P = (1,−2,−3) − (x, 0, 0) = (1− x,−2,−3)
.
Da equidistância de P a A e B temos
||
−→
PA|| = ||
−→
PB||⇒»(3− x)2 + (−1)2 + 42 =»(1− x)2 + (−2)2 + (−3)2 ⇒(
9− 6x+ x2
)
+ 1+ 16 =
(
1− 2x+ x2
)
+ 4+ 9⇒ −4x = −12⇒ x = 3.
Portanto, o ponto pedido é P (3, 0, 0).
2.3 Produto Escalar (ou Produto Interno)
Para esta seção sugerimos que o leitor recorde a definição de ângulo entre vetores que foi dada no final da Seção
2.1, pois veremos adiante que o chamado produto escalar está relacionado com a medida de ângulo entre dois vetores.
Vamos à definição:
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço com base canônica B = {~i,~j,~k}. Sejam
~u = (x1, y1, z1) e ~v = (x2, y2, z2) vetores no espaço. Definimos o produto escalar de ~u por ~v, e indicamos ~u · ~v,
como sendo o número real
~u ·~v = x1x2 + y1y2 + z1z2 .
Também é comum chamar o produto escalar de produto interno e, às vezes, ele é indicado por 〈~u,~v〉.
Enfatizamos que o adjetivo “escalar” se refere ao fato do produto definido acima ser um número real.
A motivação para definir o produto escalar, do modo como estamos fazendo, vem da Proposição 2.10 que apresen-
taremos mais abaixo. Mas antes, vejamos algumas propriedades imediatas do produto escalar, cujas demonstrações,
por serem bastante simples, ficam como exerćıcio para o leitor.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 35 de 157 páginas
Proposição 2.9 (Propriedades do produto escalar) Seja Oxyz sistema de coordenadas cartesianas ortogonais no
espaço com base canônica B = {~i,~j,~k}. Sejam ~u, ~v e ~w vetores no espaço e α ∈ R.
(1) ~u ·~0 = 0;
(2) ~u ·~v = ~v · ~u (comutativa);
(3) ~u · (~v+ ~w) = ~u ·~v+ ~u · ~w (distributiva);
(4) α (~u ·~v) = (α~u) ·~v = ~u · (α~v) (associatividade em relação ao produto por escalar);
(5) ~u · ~u > 0 e, além disso, ~u · ~u = 0 se, somente se, ~u = ~0;
(6) ||~u||2 = ~u · ~u, ou seja, ||~u|| =
√
~u · ~u.
Observação: Por causa do Item (4) da Proposição 2.9 acima podemos escrever α (~u ·~v) ou (α~u) ·~v como α~u ·~v, sem
os parênteses e sem perigo de confusão.
Cuidado: A “Lei do Cancelamento” não é uma propriedade do produto escalar, ou seja, ~u · ~v = ~w · ~v não significa
que ~u = ~w, nem mesmo quando ~v 6= ~0. Por exemplo: se ~u = (1, 0, 0), ~v = (0, 1, 0) e ~w = (0, 0, 1), então ~u · ~v =
1.0+ 0.1+ 0.0 = 0 = 0.0+ 0.1+ 1.0 = ~w ·~v mas ~u 6= ~w.
Exemplo 2.15 Mostremos que {
||~u+~v||2 = ||~u||2 + 2~u ·~v+ ||~v||2
||~u−~v||2 = ||~u||2 − 2~u ·~v+ ||~v||2 .
De fato, pelo Item (6) da Proposição 2.9 temos
||~u+~v||2 = (~u+~v) · (~u+~v) = (~u+~v) · ~u+ (~u+~v) ·~v (Item (3) da Proposição 2.9)
= ~u · (~u+~v) +~v · (~u+~v) (Item (2) da Proposição 2.9)
= ~u · ~u+ ~u ·~v+~v · ~u+~v ·~v = ||~u||2 + ~u ·~v+ ~u ·~v+ ||v||2
= ||~u||2 + 2~u ·~v+ ||v||2.
A segunda igualdade se processa de modo totalmente análogo, e será deixada como exerćıcio proposto.
Exemplo 2.16 Mostremos que
~u ·~v = 1
2
(
||~u+~v||2 − ||~u||2 − ||~v||2
)
.
Utilizando o Exemplo 2.15 acima temos:
1
2
(
||~u+~v||2 − ||~u||2 − ||~v||2
)
= 1
2
(
||~u||2 + 2~u ·~v+ ||~v||2 − ||~u||2 − ||~v||2
)
= 1
2
(2~u ·~v) = ~u ·~v.
Proposição 2.10 (Interpretação geométrica do produto escalar) Seja Oxyz sistema de coordenadas cartesianas
ortogonais no espaço com base canônica B = {~i,~j,~k}. Sejam ~u e ~v vetores no espaço e 0 6 θ 6 π a medida, em radianos,
do ângulo entre ~u e ~v. Então,
~u ·~v = ||~u||.||~v|| cos (θ) .
Demonstração da Proposição 2.10.
(Caso 1) Quando ~u e ~v são não nulos e 0 < θ < π.
Neste caso, quando posicionados com a mesma origem O, os representantes dos vetores ~u =
−−→
OA e ~v =
−→
OB
formam um triângulo OAB tal que o ângulo interno do vértice O mede θ. Além disso,
−→
AB =
−→
OB−
−−→
OA = ~v− ~u.
O A
B
u
v
q
v u-
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 36 de 157 páginas UFU GAAL
Pela Lei dosCossenos,
AB2 = OA2 +OB2 − 2.OA.OB. cos (θ)⇒ ||−→AB||2 = ||−−→OA||2 + ||−→OB||2 − 2||−−→OA||.||−→OB|| cos (θ)⇒
||~v− ~u||2 = ||~u||2 + ||~v||2 − 2||~u||.||~v|| cos (θ)
Mas ||~v− ~u||2 = ||~u||2 − 2~u ·~v+ ||~v||2, pelo Exemplo 2.15 acima.
Logo, a equação acima fica
||~u||2 − 2~u ·~v+ ||~v||2 = ||~u||2 + ||~v||2 − 2||~u||.||~v|| cos (θ)⇒ ~u ·~v = ||~u||.||~v|| cos (θ) .
(Caso 2) Quando ~u e ~v são não nulos, θ = 0 ou θ = π.
Neste caso, ~u e ~v são paralelos, ou seja, pela Proposição 2.3, existe α ∈ R tal que ~u = α~v. Isto significa que se
~v = (x, y, z), então ~u = (αx, αy, αz). Logo,
||~u||.||~v|| =
√
x2 + y2 + z2
»
(αx)
2
+ (αy)
2
+ (αz)
2
=
√
x2 + y2 + z2
Ä
|α|
√
x2 + y2 + z2
ä
= |α|
(
x2 + y2 + z2
)
.
O uv
q = p
O
u
v
q = 0
• Se θ = 0 temos ~u//~v com o mesmo sentido. Isto significa α > 0 e, portanto, |α| = α. Assim:
||~u||.||~v|| = α
(
x2 + y2 + z2
)
= x (αx) + y (αy) + z (αz) = (x, y, z) · (αx, αy, αz)⇒ ||~u||.||~v|| = ~u ·~v⇒
~u ·~v = ||~u||.||~v|| cos (0) ,
pois cos (0) = 1.
• Se θ = π temos ~u//~v com sentidos opostos. Isto significa α < 0 e, portanto, |α| = −α. Assim:
||~u||.||~v|| = −α
(
x2 + y2 + z2
)
= −(x (αx) + y (αy) + z (αz)) = − ((x, y, z) · (αx, αy, αz))⇒ ||~u||.||~v|| = −~u ·~v⇒
~u ·~v = ||~u||.||~v|| cos (π) ,
pois cos (π) = −1.
(Caso 3) Quando ~u = ~0 ou ~v = ~0.
Neste caso ~u = (0, 0, 0) ou ~v = (0, 0, 0) e, portanto, ~u ·~v = 0. Como ||~u|| = 0 ou ||~v|| = 0, segue a igualdade
~u ·~v = ||~u||.||~v|| cos (θ) .
É conveniente lembrar, neste caso, que o fato do vetor nulo ser considerado ortogonal a qualquer outro vetor,
convencionamos que θ = π
2
. Isto faz com que no segundo membro da equação tenhamos, no mı́nimo, dois fatores
iguais a zero, uma vez que cos
(
π
2
)
= 0. �
Observemos que, nas condições da Proposição 2.10 acima, dados dois vetores não nulos ~u e ~v, podemos deduzir:
(i) o ângulo entre ~u e ~v é agudo ou nulo se, e somente se, ~u ·~v > 0;
(ii) o ângulo entre ~u e ~v é reto se, e somente se, ~u ·~v = 0;
(iii) o ângulo entre ~u e ~v é obtuso ou raso se, e somente se, ~u ·~v < 0.
O
q
v
u
O
q
v
u O
q
v
u
u v 0. > u v 0. = u v 0. <
O item (ii), juntamente com o fato de que vetores nulos são ortogonais a quaisquer vetores e fazem com que o
produto escalar seja igual a zero, permite que escrevamos o seguinte corolário (consequência) da Proposição 2.10.
Corolário 2.1 Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço com base canônica B = {~i,~j,~k}. O
vetor ~u é ortogonal ao vetor ~v se, e somente se, seu produto escalar é zero. Em śımbolos:
~u ⊥ ~v⇐⇒ ~u ·~v = 0 .
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 37 de 157 páginas
Exemplo 2.17 Calculemos a medida θ do ângulo entre os vetores
(a) ~u = (2, 0,−3) e ~v = (1, 1, 1).
(b) ~u = (1, 10, 200) e ~v = (−10, 1, 0).
Item (a). Para vetores não nulos podemos escrever:
cos (θ) = ~u·~v
||~u||.||~v|| =
2.1+0.1+(−3).1√
22+02+(−3)2.
√
12+12+12
= −1√
13
√
3
= −1√
39
⇒ θ = arccos Ä− 1√
39
ä
∼= 1, 7316 rad ∼= 99, 213◦ .
Item (b). Analogamente:
cos (θ) = ~u·~v
||~u||.||~v|| =
−10+10+0√
12+102+2002
√
(−10)2+12+02
= 0⇒ θ = π
2
rad (ou seja, ~u e ~v são ortogonais).
Exemplo 2.18 Provemos que as diagonais de um losango cortam-se formando ângulo reto.
Sejam ABCD um losango com AC e BD diagonais. Consideremos os vetores ~u =
−→
AB e ~v =
−−→
AD. Logo, ~u+~v =
−→
AC
e ~v− ~u =
−→
BD.
O
A
B
C
D
u
v
v u-
u v+ v u-
u v+
Se mostrarmos que
−→
AC é ortogonal a
−→
BD, resolvemos o problema. Para tanto, basta mostrar, de acordo com o
Corolário 2.1, que o produto escalar entre
−→
AC e
−→
BD é nulo. Vejamos:
−→
AC ·
−→
BD = (~u+~v) · (~v− ~u) = ~u ·~v− ~u · ~u+~v ·~v−~v · ~u = −||~u||2 + ||~v||2.
Mas ABCD é um losango, portanto, possui os quatro lados com mesmo comprimento. Logo, AB = AD, ou seja,
||
−→
AB|| = ||
−−→
AD||. Portanto, ||~u|| = ||~v||.
Desta forma: −→
AC ·
−→
BD = 0
e, portanto, as diagonais de um losango são ortogonais.
Uma curiosidade.
Vimos que o produto escalar, da forma como definimos, está relacionado com a medida do ângulo entre dois
vetores.
Haveria outra forma de definir o produto escalar de modo a obter uma equação simples envolvendo a medida
usual de ângulo entre vetores? A resposta é não. Vejamos como justificar isso.
Trabalhando com coordenadas na base canônica do espaço, consideremos dois vetores não nulos ~u = (x1, y1, z1)
e ~v = (x2, y2, z2). Suponhamos, ainda que os ângulo entre eles mede θ e não é nem nulo e nem raso (0 < θ < π).
Chamando ~u =
−−→
OA e ~v =
−→
OB, sendo O = (0, 0, 0), temos um triângulo OAB tal que o ângulo interno do vértice
O mede θ. Além disso,
−→
AB =
−→
OB−
−−→
OA = ~v− ~u = (x2, y2, z2) − (x1, y1, z1) = (x2 − x1, y2 − y1, z2 − z1) .
Pela Lei dos Cossenos aplicada ao triângulo OAB:
||~u||2 + ||~v||2 − 2||~u||.||~v|| cos (θ) = ||~v− ~u||2 =
Å»
(x2 − x1)
2
+ (y2 − y1)
2
+ (z2 − z1)
2
ã2
= (x2 − x1)
2
+ (y2 − y1)
2
+ (z2 − z1)
2
=
(
x22 − 2x2x1 + x
2
1
)
+
(
y22 − 2y2y1 + y
2
1
)
+
(
z22 − 2z2z1 + z
2
1
)
=
(
x21 + y
2
1 + z
2
1
)
+
(
x22 + y
2
2 + z
2
2
)
− 2 (x2x1 + y2y1 + z2z1)
= ||~u||2 + ||~v||2 − 2 (x2x1 + y2y1 + z2z1)⇒
||~u||.||~v|| cos (θ) = x2x1 + y2y1 + z2z1 ,
o que faz com que a definição de produto escalar que demos, ~u · ~v = x2x1 + y2y1 + z2z1, esteja de acordo com a
Proposição 2.10 e seja bastante conveniente quando a intenção é trabalhar com ângulos.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 38 de 157 páginas UFU GAAL
Exemplo 2.19 (Desigualdade de Cauchy-Schwarz) Mostremos que |~u ·~v| 6 ||~u||.||~v||.
Pela Proposição 2.10 temos ~u ·~v = ||~u||.||~v|| cos (θ), sendo θ a medida do ângulo entre ~u e ~v. Logo,
|~u ·~v| = | ||~u||.||~v|| cos (θ) | = ||~u||.||~v||.| cos (θ) |
Mas −1 6 cos (θ) 6 1. Portanto, 0 6 | cos (θ) | 6 1, o que permite a conclusão da desigualdade:
| cos (θ) | 6 1⇒ ||~u||.||~v||.| cos (θ) | 6 ||~u||.||~v||⇒ |~u ·~v| 6 ||~u||.||~v|| .
Exemplo 2.20 (Desigualdade triangular) Mostremos que ||~u+~v|| 6 ||~u||+ ||~v||.
Pelo Exemplo 2.15 temos
||~u+~v||2 = ||~u||2 + 2~u ·~v+ ||~v||2 ⇒ | ||~u+~v||2| = | ||~u||2 + 2~u ·~v+ ||~v||2|⇒ ||~u+~v||2 6 ||~u||2 + 2|~u ·~v|+ ||~v||2.
Pelo Exemplo 2.19 temos |~u ·~v| 6 ||~u||.||~v||. Logo,
||~u+~v||2 6 ||~u||2 + 2|~u ·~v|+ ||~v||2 6 ||~u||2 + 2||~u||.||~v||+ ||~v||2 = (||~u||+ ||~v||)2 ⇒
||~u+~v|| 6 ||~u||+ ||~v|| .
u
v
u v+
Sejam ~u um vetor não nulo e B = {~i,~j,~k} a base canônica do espaço cartesiano. Os ângulos formados pelo vetor
~u com cada um dos vetores da base canônica são chamados de ângulos diretores de ~u. Os cossenos das medidas
dos ângulos diretores de ~u possuem uma relação interessante, conforme veremos abaixo, e são chamados de cossenos
diretores de ~u.
Exemplo 2.21 (Cossenos diretores) Sejam α,β e γ as medidas dos ângulos diretores do vetor ~u = (x, y, z), ~u 6= ~0,
com os vetores ~i, ~j e ~k da base canônica, respectivamente. Mostremos os seguintes itens envolvendo os cossenos
diretores de ~u:
(a)

cos (α) = x√
x2+y2+z2
cos (β) = y√
x2+y2+z2
cos (γ) = z√
x2+y2+z2
(b) cos2 (α) + cos2 (β) + cos2 (γ) = 1.
(c) ~u
||~u|| = (cos (α) , cos (β) , cos (γ)) ou, equivalentemente, ~u = (||~u|| cos (α) , ||~u|| cos (β) , ||~u|| cos (γ)).
De fato:
• Quanto ao Item (a), temos ~i = (1, 0, 0). Logo, pela Proposição 2.10,
cos (α) = ~u·
~i
||~u||.||~i||
= (x,y,z)·(1,0,0)√
x2+y2+z2.
√
12+02+02
= x√
x2+y2+z2
.
De modo análogo para cos (β) e cos (γ).
• Quanto ao Item (b), temos:
cos2 (α) + cos2 (β) + cos2 (γ) = ( x√
x2+y2+z2
)2 + ( y√
x2+y2+z2
)2 + ( z√
x2+y2+z2
)2
= x
2
x2+y2+z2
+ y
2
x2+y2+z2
+ z
2
x2+y2+z2
= x
2+y2+z2
x2+y2+z2
= 1
• Quanto ao Item (c), temos:
~u
||~u|| =
(x,y,z)√
x2+y2+z2
=
(√
x2+y2+z2 cos(α),
√
x2+y2+z2 cos(β),
√
x2+y2+z2 cos(γ)
)
√
x2+y2+z2
; (Item (a) )
=
√
x2+y2+z2(cos(α),cos(β),cos(γ))√x2+y2+z2
= (cos (α) , cos (β) , cos (γ)) .
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 39 de 157 páginas
Observações:
No Item (a) do Exemplo 2.21 acima, o produto escalar fornece um modo muito simples de calcular as medidas dos
ângulos de um vetor com os vetores da base canônica. Este mesmo exerćıcio, sem o uso do produto escalar, já não é
tão simples de resolver.
O Item (b) pode ser usado como uma condição para a existência de vetores, dados os ângulos diretores. Para que
o vetor exista, a equação tem que ser satisfeita.
No Item (c) é interessante notar que as coordenadas do versor de um vetor não nulo ~u são, exatamente, os cossenos
diretores de ~u.
Exemplo 2.22 Seja ~u =
Ä
1,−3,
√
6
ä
. Calculemos seus cossenos diretores e verifiquemos que a soma de seus quadrados
é, realmente, igual a 1.
Pelo Item (a) do Exemplo 2.21 acima:
cos (α) = 1»
12+(−3)2+(
√
6)
2
= 1
4
cos (β) = −3»
12+(−3)2+(
√
6)
2
= −3
4
cos (γ) =
√
6»
12+(−3)2+(
√
6)
2
=
√
6
4
Temos
cos2 (α) + cos2 (β) + cos2 (γ) =
(
1
4
)2
+
(
−3
4
)2
+
Ä√
6
4
ä2
= 1
16
+ 9
16
+ 6
16
= 1.
Vetor Projeção Ortogonal
Consideremos dois vetores ~u e ~v no espaço, sendo ~v 6= ~0. Tomemos ambos os vetores com a mesma origem O.
Chamemos ~u =
−−→
OA e r a reta suporte de ~v passando por O (ou seja, r é a reta paralela a ~v passando por O).
Seja P a projeção ortogonal do ponto A na reta r, isto é, P é o pé da perpendicular baixada de A até a reta r.
O vetor
−→
OP é chamado de vetor projeção ortogonal de ~u na direção de ~v e escrevemos proj~v ~u.
u
v
proj
v
u
A
O P r
A próxima proposição fornece uma expressão para o vetor projeção ortogonal em termos do produto escalar.
Proposição 2.11 (Vetor projeção ortogonal) Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço com
base canônica B = {~i,~j,~k}. Sejam ~u vetor qualquer e ~v 6= ~0. Então, o vetor projeção ortogonal de ~u na direção do vetor
~v é dado por
proj~v ~u =
~u·~v
||~v||2
~v .
Demonstração da Proposição 2.11.
O vetor projeção ortogonal proj~v ~u é paralelo a ~v. Logo, pela Proposição 2.3, existe α ∈ R tal que proj~v ~u = α~v.
u
vav
proj =
v
u av
w u w=
v0v 0=
proj =
v
u 0 =v 0
q q
u
vav
proj =
v
u av
w
q
(a > )0 (a = 0) (a < 0)
u w 0= =
v0v 0=
proj =
v
u 0 =v 0
Façamos ~w = ~u− α~v. Temos ~w ⊥ ~v e, pelo Corolário 2.1, temos:
~w ·~v = 0⇒ (~u− α~v) ·~v = 0⇒ (~u ·~v) − α (~v ·~v) = 0⇒ ~u ·~v− α||~v||2 = 0⇒ α = ~u·~v
||~v||2
.
Portanto, proj~v ~u =
~u·~v
||~v||2
~v. �
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 40 de 157 páginas UFU GAAL
Exemplo 2.23 Achemos as coordenadas da projeção do vetor ~u = (1,−1, 2) na direção do vetor ~v = (3,−1, 1).
Pela Proposição 2.11 temos proj~v ~u =
~u·~v
||~v||2
~v. Logo:
proj~v ~u =
(1,−1,2)·(3,−1,1)(√
32+(−1)2+12
)2 (3,−1, 1)⇒ proj~v ~u = (1811 ,− 611 , 611) .
Exemplo 2.24 Escrevamos ~w = (−1,−3, 2) como soma de dois vetores ~w1 e ~w2, sendo ~w1 paralelo a ~v = (0, 1, 3) e
~w2 ortogonal a este último.
O vetor ~w1 é a projeção ortogonal de ~w na direção de ~v.
vw1
w2
w
Logo:
~w1 = proj~v ~w =
~w·~v
||~v||2
~v = (−1,−3,2)·(0,1,3)
(
√
02+12+32)
2 (0, 1, 3) =
(
0, 3
10
, 9
10
)
O vetor ~w2 é tal que
~w = ~w1 + ~w2 ⇒ ~w2 = (−1,−3, 2) − (0, 310 , 910) = (−1,−3310 , 1110)
Observemos que, realmente, ~w1 ⊥ ~w2 pois ~w1 · ~w2 = 0.
2.4 Produto Vetorial
Nesta seção vamos definir um novo produto entre vetores, chamado produto vetorial que, ao contrário do produto
escalar e, como o próprio nome diz, tem por resultado um vetor. Veremos adiante que produto vetorial está relacionado
com áreas, o que faz com ele seja de extrema importância em várias áreas da Matemática. Vamos à definição:
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço com base canônica B = {~i,~j,~k}. Sejam
~u = (x1, y1, z1) e ~v = (x2, y2, z2) vetores no espaço. Definimos o produto vetorial de ~u por ~v (nessa ordem) como
sendo o vetor
~u×~v = det
ï
y1 z1
y2 z2
ò
~i− det
ï
x1 z1
x2 z2
ò
~j+ det
ï
x1 y1
x2 y2
ò
~k =
Å
det
ï
y1 z1
y2 z2
ò
,−det
ï
x1 z1
x2 z2
ò
,det
ï
x1 y1
x2 y2
òã
.
Observação: A definição do produto vetorial sugere a aplicação do Desenvolvimento de Laplace para cálculo do
determinante na primeira linha da matriz com entradas mistas ~i ~j ~kx1 y1 z1
x2 y2 z2
 .
Estamos empregando a palavra “sugere” e “entradas mistas” porque a matriz acima possui a primeira linha
constitúıda de vetores, enquanto que as demais linhas são números reais. O desenvolvimento de Laplace geralmente é
aplicado em matrizes quadradas com entradas numéricas e, portanto, o resultado é um número, algo que não ocorre
no caso em que estamos considerando.
Com a observação acima e com uma boa dose de abuso de notação matemática, podemos facilitar o cálculo do
produto vetorial aplicando a Regra de Sarrus (que vale apenas para o cálculo de determinantes de matrizes 3× 3) na
matriz mista acima, ou seja,
~u×~v ≡ det
 ~i ~j ~kx1 y1 z1
x2 y2 z2
 .
Exemplo 2.25 Calculemos ~u×~v, sendo ~u = (1, 2, 3) e ~v = (−1, 1, 2).
Pela definição dada de produto vetorial:
~u×~v ≡ det
 ~i ~j ~k1 2 3
−1 1 2
 ≡ (4− 3)~i+ (−3− 2)~j+ (1+ 2)~k = (1,−5, 3) .
Vejamos algumas propriedades do produto vetorial.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 41 de 157 páginas
Proposição 2.12 (Propriedades do produto vetorial) Seja Oxyz sistema de coordenadas cartesianas ortogonais no
espaço com base canônica B = {~i,~j,~k}.
Sejam ~u, ~v e ~w vetores no espaço e α ∈ R.
(1) ~u× ~v = ~0 se, e somente se, ~u é paralelo a ~v. Particularmente, a propriedade é verdadeira quando ~u ou ~v é o vetor
nulo.
(2) ~u×~v = −~v× ~u (portanto, o produto vetorial não é comutativo);
(3) ~u× (~v+ ~w) = ~u×~v+ ~u× ~w (distributiva à direita) e (~u+~v)× ~w = ~u× ~w+~v× ~w (distributiva à esquerda);
(4) α (~u×~v) = (α~u)×~v = ~u× (α~v) (associativa em relação ao produto por escalar);
(5) ~u · (~v× ~w) = (~u×~v) · ~w (comutatividade em relação aos produtos escalar e vetorial)
Observemos que no Item (5) das propriedades do produto vetorial acima, ~u · (~v× ~w) é um número e não um vetor.
Além disso, como não faz sentido a expressão (~u ·~v)× ~w (pois produto vetorial envolve dois vetores e não um número
e um vetor), podemos omitir os parênteses e escrever esta propriedade simplesmente como ~u · ~v × ~w = ~u × ~v · ~w.
Veremos mais propriedades do número ~u ·~v× ~w na próxima seção.
A próxima proposição relaciona o produto vetorial a área e é de extrema importância no desenvolvimento teórico
do estudo de vetores.
Proposição 2.13 (Caracterização geométrica do produto vetorial) Seja Oxyz sistema de coordenadas cartesianas
ortogonais no espaço com base canônica B = {~i,~j,~k}. Sejam ~u e ~v vetores não paralelos no espaço. Então:
(1) a direção de ~u×~v é ortogonal às direções de ~u e de ~v simultaneamente.
(2) o sentido de ~u×~v satisfaz a “regra da mão direita”, ou seja, ~u, ~v e ~u×~v possuem os sentidos estabelecidos pelos
dedos indicador, médio e polegar, respectivamente, da mão direita (o mesmo da base conônica B = {~i,~j,~k}). De modo
rigoroso, do ponto de vista matemático, o sentido de ~u × ~v é tal que, escrevendo ~u = (x1, y1, z1), ~v = (x2, y2, z2) e
~u×~v = (x3, y3, z3), então
det
x1 y1 z1x2 y2 z2
x3 y3 z3
 > 0.
(3) o comprimento de ~u×~v é numericamente igual a área A (ABCD) do paralelogramo ABCD gerado por (ou baseado
em) ~u =
−→
AB e ~v =
−−→
AD, ou seja,
A (ABCD) = ||~u×~v|| C
B
A
D
v
u
u v´
Exemplo 2.26 Dados os vetores ~u = (3,−1, 2) e ~v = (−2, 2, 1), calculemos:
(a) a área do paralelogramo determinado por ~u e ~v.
(b) a altura do paralelogramo relativa à base definida pelo vetor ~v.Temos no Item (a):
~u×~v ≡ det
 ~i ~j ~k3 −1 2
−2 2 1
 ≡ (−1− 4)~i+ (−4− 3)~j+ (6− 2)~k = (−5,−7, 4) .
Pela Proposição 2.13 temos:
A = ||~u×~v|| = || (−5,−7, 4) || =
»
(−5)
2
+ (−7)
2
+ 42 =
√
25+ 49+ 16 =
√
90 = 3
√
10.
Quanto ao Item (b), devemos lembrar, da Geometria, que a área de um paralelogramo é o produto do comprimento
da base pela altura h. Neste caso, o comprimento da base é ||~v|| =
»
(−2)
2
+ 22 + 12 = 3.
De A = ||~v||h temos, aproveitando o Item (a), que 3
√
10 = 3h, ou seja, h =
√
10.
Exemplo 2.27 Calculemos a área do triângulo ABC sendo
−→
AC = (1, 1, 3) e
−→
CB = (−1, 1, 0).
Consideremos a figura abaixo:
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 42 de 157 páginas UFU GAAL
B
D
A
C
v
u
v ux
v
Tomemos ~u =
−→
AC e ~v =
−→
CB. A área A (ABC) do triângulo ABC é metade da área do paralelogramo ADBC, sendo
−−→
AD = ~v =
−→
CB.
De acordo com a Proposição 2.13, a área do paralelogramo ADBC, gerado por ~v e ~u é, numericamente, o compri-
mento do vetor ~v× ~u =
−→
CB×
−→
AC.
Logo,
A (ABC) = 1
2
||
−→
CB×
−→
AC||.
Mas,
−→
CB×
−→
AC ≡ det
 ~i ~j ~k−1 1 0
1 1 3
 ≡ 3~i+ 3~j+ (−1− 1)~k = (3, 3,−2) .
Conclusão: A (ABC) = 1
2
||
−→
CB×
−→
AC|| = 1
2
|| (3, 3,−2) || = 1
2
»
32 + 32 + (−2)
2
=
√
22
2
.
Às vezes, é útil calcularmos o comprimento do vetor produto vetorial em função da medida θ do ângulo entre os
vetores envolvidos. A próxima proposição apresenta essa fórmula.
Proposição 2.14 Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço com base canônica B = {~i,~j,~k}.
Sejam ~u e ~v vetores não paralelos e 0 < θ < π a medida do ângulo, em radianos, entre os vetores ~u e ~v. Então:
||~u×~v|| = ||~u||.||~v|| sen (θ) .
Demonstração da Proposição 2.14.
Vamos dividir a demonstração em três casos:
• (1) Ângulo agudo: 0 < θ < π
2
.
Observemos a figura abaixo à esquerda.
C
D
D
v
u
C
A
D
v
uq
C
B
A
v
u
u vx
q
B
D
q
u
v
C
BA
h
D
q
C
BA
h
D
q
u
v
C
BA H=
h
u
v
u vx
A
q
B
u vx
agudo reto obtuso
H H
A área A do paralelogramo gerado pelos vetores ~u =
−→
AB e ~v =
−−→
AD é dada por A = ||~u||.h, sendo h a altura do
paralelogramo baixada do vértice D ao lado AB.
Da trigonometria aplicada ao triângulo AHD temos sen (θ) = DH
AD
= h
||~v|| ⇒ h = ||~v|| sen (θ).
Portanto, A = ||~u||.||~v|| sen (θ).
Pelo Item (3) da Proposição 2.13, temos A = ||~u×~v||.
Portanto,
||~u×~v|| = ||~u||.||~v|| sen (θ) .
• (2) Ângulo reto: θ = π
2
. Observemos a figura acima ao centro.
Neste caso, o paralelogramo gerado por ~u e ~v é, na verdade, um retângulo. Sua área é, portanto, dada por
A = ||~u||.||~v||.
Como sen
(
π
2
)
= 1, então podemos escrever A = ||~u||.||~v|| sen
(
π
2
)
.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 43 de 157 páginas
Pelo Item (3) da Proposição 2.13, temos A = ||~u×~v||.
Portanto,
||~u×~v|| = ||~u||.||~v|| sen
(
π
2
)
.
• (3) Ângulo obtuso: π
2
< θ < π.
Observemos a figura acima à direita.
A área A do paralelogramo gerado pelos vetores ~u =
−→
AB e ~v =
−−→
AD é dada por A = ||~u||.h, sendo h a altura do
paralelogramo baixada do vértice D à reta que contém o lado AB (neste caso, o ponto H não está no segmento AB).
Da trigonometria aplicada ao triângulo AHD temos sen (π− θ) = DH
AD
= h
||~v|| ⇒ h = ||~v|| sen (π− θ).
Mas sen (π− θ) = sen (π) cos (θ) − sen (θ) cos (π) = sen (θ).
Portanto, h = ||~v|| sen (θ), implicando em A = ||~u||.||~v|| sen (θ).
Pelo Item (3) da Proposição 2.13, temos A = ||~u×~v||.
Portanto,
||~u×~v|| = ||~u||.||~v|| sen (θ) .
Concluimos que, em qualquer situação:
||~u×~v|| = ||~u||.||~v|| sen (θ) ,
como queŕıamos. �
Exemplo 2.28 A medida, em radianos, do ângulo entre ~u e ~v é π
6
. Sendo ||~u|| = 1 e ||~v|| = 7, calculemos ||~u × ~v|| e∥∥1
3
~u× 3
4
~v
∥∥.
Utilizando a Proposição 2.14 acima temos:
• No primeiro caso: ||~u×~v|| = ||~u||.||~v|| sen
(
π
6
)
= 1.7.1
2
= 7
2
.
• No segundo caso:
∥∥1
3
~u× 3
4
~v
∥∥ = 1
3
.3
4
. ||~u×~v|| = 1
3
.3
4
.7
2
= 7
8
.
Exemplo 2.29 Seja B = {~i,~j,~k} base canônica do sistema de coordenadas cartesianas ortogonais Oxyz do espaço.
Mostremos que ~i×~j = ~k, ~j× ~k =~i e ~k×~i =~j.
No sistema de coordenadas temos ~i = (1, 0, 0), ~j = (0, 1, 0) e ~k = (0, 0, 1). Logo,
~i×~j ≡ det
~i ~j ~k1 0 0
0 1 0
 ≡ 0~i+ 0~j+ 1~k = (0, 0, 1) = ~k ; ~j× ~k ≡ det
~i ~j ~k0 1 0
0 0 1
 ≡ 1~i+ 0~j+ 0~k = (1, 0, 0) =~i
~k×~i ≡ det
~i ~j ~k0 0 1
1 0 0
 ≡ 0~i+ 1~j+ 0~k = (0, 1, 0) =~j
Observação: Quando uma base ortonormal e ordenada cumpre a propriedade apresentada por este exemplo, ou seja,
quando, respeitando-se a ordem dos vetores da base, o produto vetorial de dois vetores consecutivos é o seguinte,
formando um ciclo ordenado e fechado, dizemos que a base possui orientação positiva . Logo, B = {~i,~j,~k} possui
orientação positiva.
~k↙ ↖
~i −→ ~j
~i → ~j → ~k → ~i → ~j → ~k → · · ·
~i × ~j = ~k
~j × ~k = ~i
~k × ~i = ~j
~i × ~j = ~k e se repete ...
No produto vetorial não vale ...
• (1) No produto vetorial não vale a propriedade comutativa, ou seja, geralmente ~u×~v 6= ~v× ~u.
Os próprios vetores ~i e ~j da base canônica B = {~i,~j,~k} servem de exemplo: façamos ~u = ~i e ~v = ~j. Logo,
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 44 de 157 páginas UFU GAAL
~u×~v =~i×~j = ~k (exemplo acima) e
~v× ~u =~j×~i ≡ det
~i ~j ~k0 1 0
1 0 0
 ≡ 0~i+ 0~j− 1~k = (0, 0,−1) = −~k
Conclusão: ~u×~v 6= ~v× ~u.
• (2) No produto vetorial não vale a propriedade associativa, ou seja, geralmente (~u×~v)× ~w 6= ~u× (~v× ~w).
Mais uma vez, os vetores ~i e ~j da base canônica B = {~i,~j,~k} servem de exemplo: façamos ~u = ~v = ~i e ~w = ~j.
Logo  (~u×~v)× ~w =
Ä
~i×~i
ä
×~j = ~0×~j = ~0 (faça!)
~u× (~v× ~w) =~i×
Ä
~i×~j
ä
=~i× ~k = −~j (faça!)
.
Conclusão: (~u×~v)× ~w 6= ~u× (~v× ~w).
• (3) No produto vetorial não vale a “Lei do Cancelamento”, ou seja, geralmente ~u × ~v = ~u × ~w não implica em
~v = ~w.
Eis um exemplo: ~u = ~w = (1, 0, 0) e ~v = (6, 0, 0). Temos ~u×~v = ~0 = ~u× ~w (faça!) e, no entanto, ~v 6= ~w.
2.5 Produto Misto
Vimos que é posśıvel definir duas operações de produto distintas envolvendo vetores: o produto escalar (que é
número) e o produto vetorial (que é vetor). Nesta seção iremos definir o produto misto. Na verdade, não trata-se de
uma nova operação entre os vetores, mas apenas combinação dos dois produtos já definidos. A motivação vem da
propriedade ~u · ~v × ~w = ~u × ~v · ~w, sendo ~u, ~v e ~w vetores quaisquer do espaço (esta propriedade é o Item (5) da
Proposição 2.12, vista na Seção 2.4 acima). Nesta propriedade podemos constatar que, desde que a ordem dos vetores
~u, ~v e ~w não mude, podemos comutar os produtos escalar e vetorial. Sendo assim, temos a motivação para definir o
chamado produto misto, conforme abaixo:
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço com base canônica B = {~i,~j,~k}.
O número real ~u ·~v× ~w é chamado de produto misto dos vetores ~u, ~v e ~w (nesta ordem).
Em alguns textos, o produto misto acima é indicado por [~u,~v, ~w].
O produto misto possui uma propriedade geométrica impressionante. Por mais incŕıvel que possa parecer, ele está
relacionado com volume no espaço, o que torna seu estudo extremamente importante. Mas antes, vejamos um modo
simples de calcular o produto misto sem ter que fazer os dois produtos (escalar e vetorial) indicados em sua definição.
Proposição 2.15 Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço com base canônica B = {~i,~j,~k}.
Se ~u = (x1, y1, z1), ~v = (x2, y2, z2) e ~w = (x3, y3, z3), então
~u ·~v× ~w = det
x1 y1 z1x2 y2 z2
x3 y3 z3
 .
Exemplo 2.30 Calculemos o produto misto de ~u = (−1,−3, 1), ~v= (1, 0, 1) e ~w = (2, 1, 1).
Temos:
~u ·~v× ~w = det
−1 −3 11 0 1
2 1 1
 = 0+ 1− 6− 0+ 3+ 1 = −1.
Agora, algumas propriedades algébricas do produto misto.
Proposição 2.16 (Propriedades do produto misto). Seja Oxyz sistema de coordenadas cartesianas ortogonais no
espaço com base canônica B = {~i,~j,~k}.
(1) Sejam ~u, ~v, ~w vetores no espaço. Então, ~u ·~v× ~w = 0 se, e somente se, os vetores ~u, ~v e ~w forem coplanares.
Particularmente, se algum dos três vetores for nulo, ou se dois dos vetores forem paralelos, temos o produto misto nulo.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 45 de 157 páginas
(2) Se dois vetores forem comutados no produto misto ~u ·~v× ~w, então o produto misto muda de sinal, ou seja,
~u ·~v× ~w = −~v · ~u× ~w = −~w ·~v× ~u = −~u · ~w×~v.
(3) Sejam ~u, ~u1, ~u2, ~v, ~v1, ~v2, ~w, ~w1 e ~w2 vetores no espaço. Então, (
~u1 + ~u2) ·~v× ~w = ~u1 ·~v× ~w+ ~u2 ·~v× ~w;
~u · (~v1 +~v2)× ~w = ~u ·~v1 × ~w+ ~u ·~v2 × ~w;
~u ·~v× (~w1 + ~w2) = ~u ·~v× ~w1 + ~u ·~v× ~w2.
(4) Sejam ~u, ~v, ~w vetores no espaço e α ∈ R. Então,
α (~u ·~v× ~w) = (α~u) ·~v× ~w = ~u · (α~v)× ~w = ~u ·~v× (α~w) .
(5) Sejam ~u, ~v, ~w vetores no espaço e α,β ∈ R. Então,
~u ·~v× ~w = (~u+ α~v+ β~w) ·~v× ~w;
~u ·~v× ~w = ~u · (~v+ α~u+ β~w)× ~w;
~u ·~v× ~w = ~u ·~v× (~w+ α~u+ β~v) .
Exemplo 2.31 Mostremos que (~u+~v) · (~v+ ~w)× (~w+ ~u) = 2 (~u ·~v× ~w).
Temos, de acordo com os Itens (1) (2) e (3) da Proposição 2.16:
(~u+~v) · (~v+ ~w)× (~w+ ~u) = ~u · (~v+ ~w)× (~w+ ~u) +~v · (~v+ ~w)× (~w+ ~u)
= ~u ·~v× (~w+ ~u) + ~u · ~w× (~w+ ~u) +~v ·~v× (~w+ ~u) +~v · ~w× (~w+ ~u)
= ~u ·~v× (~w+ ~u) +~v · ~w× (~w+ ~u) (pois ~u, ~w, ~w+ ~u e ~v, ~v, ~w+ ~u são coplanares)
= ~u ·~v× ~w+ ~u ·~v× ~u+~v · ~w× ~w+~v · ~w× ~u
= ~u ·~v× ~w+~v · ~w× ~u (pois ~u, ~v, ~u e ~v, ~w, ~w são coplanares)
= ~u ·~v× ~w+ ~u ·~v× ~w (no segundo produto misto foram duas inversões)
= 2 (~u ·~v× ~w) ,
como queŕıamos.
O Item (1) das propriedades do produto misto apresentada na Proposição 2.16 acima permite uma consequência
importante (corolário), sendo útil para verificar a coplanaridade de 4 pontos no espaço.
Dados 4 pontos A, B, C e D no espaço, podemos construir 3 vetores:
−→
AB,
−→
AC e
−−→
AD, todos com a mesma origem
A. Esses 3 vetores são coplanares se, e somente se, seu produto misto é nulo, o que equivale dizer que A, B, C e D
são coplanares se, e somente se, o produto misto dos 3 vetores em questão é nulo.
Sintetizamos esse resultado no corolário abaixo:
Corolário 2.2 Nas condições da Proposição 2.16 temos:
A, B, C e D são coplanares ⇐⇒ −→AB · −→AC×−−→AD = 0 .
Fazendo A (x1, y1, z1), B (x2, y2, z2), C (x3, y3, z3) e D (x4, y4, z4), o resultado acima em, termos de coordenadas,
pode ser expresso do seguinte modo:
A, B, C e D são coplanares ⇐⇒ det
x2 − x1 y2 − y1 z2 − z1x3 − x1 y3 − y1 z3 − z1
x4 − x1 y4 − y1 z4 − z1
 = 0 .
É claro que, devido à equivalência, a negação é válida, ou seja, A, B, C eD não são coplanares⇐⇒ −→AB·−→AC×−−→AD 6= 0.
Vejamos um exemplo.
Exemplo 2.32 Verifiquemos que os pontos A (1, 0, 2), B (−3, 7, 0), C (1, 5,−3) e D (−3, 12,−5) são coplanares.
Temos: 
−→
AB = B−A = (−3, 7, 0) − (1, 0, 2) = (−4, 7,−2) ;
−→
AC = C−A = (1, 5,−3) − (1, 0, 2) = (0, 5,−5) ;
−−→
AD = D−A = (−3, 12,−5) − (1, 0, 2) = (−4, 12,−7)
.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 46 de 157 páginas UFU GAAL
Logo:
−→
AB ·
−→
AC×
−−→
AD = det
−4 7 −20 5 −5
−4 12 −7
 = 140+ 0+ 140− 40− 0− 240 = 0,
ou seja, A, B, C e D são coplanares.
Por fim, o principal motivo da existência do produto misto: sua caracterização geométrica.
Proposição 2.17 (Caracterização geométrica do produto misto). Seja Oxyz sistema de coordenadas cartesianas
ortogonais no espaço com base canônica B = {~i,~j,~k}. Sejam ~u, ~v e ~w vetores não coplanares. Então, o volume V do
paraleleṕıpedo gerado por (ou baseado em) ~u, ~v e ~w é igual ao módulo do produto misto ~u ·~v× ~w, ou seja,
V = |~u ·~v× ~w| .
v
u
w
Paralelepípedo
O
Demonstração da Proposição 2.17.
Consideremos os vetores ~u, ~v, ~w e ~u × ~v com representantes de mesma origem O e tomemos os vetores ~u e ~v
como geradores da base do paraleleṕıpedo.
Chamemos, ainda, de θ a medida do ângulo formado por ~w e ~u×~v.
Temos duas posśıveis posições em relação aos vetores ~w e ~u×~v:
(i) Ambos estão no mesmo lado do plano que passa pela base do paraleleṕıpedo e, neste caso, 0 6 θ < π
2
.
(ii) Cada um está em um dos lados opostos do plano que passa pela base do paraleleṕıpedo e, neste caso, π
2
< θ 6 π.
A figura abaixo ilustra as duas situações posśıveis.
v
u
w
u vx q
v
u
w
q
u vx
w
h
p - q
p - q
wq
h
OO
Observemos que θ = π
2
não ocorre, pois os vetores ~u, ~v e ~w não são coplanares.
Lembrando que o volume V do paraleleṕıpedo é dado pelo produto da área A de sua base por sua altura h,
ou seja, V = Ah, nossa preocupação será com a altura, pois pela Proposição 2.13, a área da base é dada por
A = ||~u×~v||.
No caso (i) a altura h do paraleleṕıpedo é dada por h = ||~w|| cos (θ).
No caso (ii) a altura h do paraleleṕıpedo é dada por h = ||~w|| cos (π− θ).
Como
cos (π− θ) = cos (π) cos (θ) + sen (π) sen (θ) = − cos (θ) ,
podemos escrever, no caso (ii), h = ||~w|| (− cos (θ)).
Juntando os dois casos, para não nos preocuparmos com sinais, podemos escrever h = | ||~w|| cos (θ) |.
Deste modo:
V = A.h = ||~u×~v||.| ||~w|| cos (θ) | = | ||~u×~v||.||~w|| cos (θ) | = | (~u×~v) · ~w|⇒
V = |~u ·~v× ~w| .
Na primeira linha acima, utilizamos a Proposição 2.10, que relaciona o produto escalar com a medida de ângulo
entre dois vetores.
Na conclusão usamos a propriedade (5) da Proposição 2.12, que permite comutar o produto escalar com o
produto vetorial. �
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 47 de 157 páginas
Exemplo 2.33 Calculemos o volume V do paraleleṕıpedo gerado pelos vetores ~u = (1, 0, 1), ~v = (0, 3, 3) e ~w = (2, 1, 2).
De acordo com a Proposição 2.17, o módulo do produto misto de ~u, ~v e ~w fornece o volume do paraleleṕıpedo em
questão. Logo:
V = |~u ·~v× ~w| =
∣∣∣∣∣∣det
1 0 10 3 3
2 1 2
∣∣∣∣∣∣ = |6+ 0+ 0− 6− 0− 3| = |−3| = 3.
Considerando que todo paraleleṕıpedo pode ser decomposto em seis tetraedros, a Proposição 2.17 possui uma
consequência interessante enunciada abaixo.
Corolário 2.3 Nas condições da Proposição 2.17, o volume V do tetraedro gerado por (ou baseado em) ~u, ~v e ~w é igual
a um sexto do módulo do produto misto ~u ·~v× ~w, ou seja,
V = |~u·~v×~w|
6
.
v
u
w
Tetraedro
A t́ıtulo de ilustração, vamos “recortar” um paraleleṕıpedo em 6 tetraedros, todos de mesmo volume. Para facilitar,
vamos tomar um paraleleṕıpedo reto retângulo (bloco retangular), mas o racioćınio é válido de modo generalizado.
Comecemos dividindo o paralelepipedo em dois prismas triangulares de mesmo volume, que chamaremos de “Prisma
Triangular 1” e “Prisma Triangular 2”, conforme a figura abaixo.
Paralelepípedo
= +
Prisma Triangular 1 Prisma Triangular 2
Em seguida, tomamos o “Prisma Triangular 1” e o dividimos em 3 pirâmides de bases triangulares, que são os
tetraedros, todos de mesmo volume, e chamaremos de “Tetraedros 1, 2 e 3”. Recordando que a fórmula do volume
VP de uma pirâmide é VP =
1
3
(área da base) (altura), o leitor não terá dificuldades para verificar que, realmente, os
tetraedos possuem o mesmo volume. A figura abaixo apresenta o procedimento.
= +
Prisma Triangular 1
+
Tetraedro 1 Tetraedro 2 Tetraedro 3
Finalmente, fazemos a mesma divisão como o “Prisma Triangular 2” e o dividimos nos “Tetraedros 4, 5 e 6”, todos
de mesmo volume, ficando assim, ilustrado o Corolário 2.3. A figura abaixo mostra esta última etapa.
= +
Prisma Triangular2
+
Tetraedro 4 Tetraedro 5 Tetraedro 6
Exemplo 2.34 Calculemos o volume do tetraedro ABCD sendo
−→
AB = (1, 1, 0),
−→
AC = (0, 1, 1) e
−−→
AD = (−4, 0, 0).
Conforme vimos no Corolário 2.3, o volume V pedido é 1
6
do volume do paraleleṕıpedo gerado pelos vetores
fornecidos.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 48 de 157 páginas UFU GAAL
Logo,
V = 1
6
|~u ·~v× ~w| = 1
6
∣∣∣∣∣∣det
 1 1 00 1 1
−4 0 0
∣∣∣∣∣∣ = 16 |0+ 0− 4− 0− 0− 0| = 23 .
Exemplo 2.35 Calculemos o volume da pirâmide de base ABC e vértice P, sendo A (4, 0, 0), B (4, 8, 0) e C (0, 6, 0) e
P (4,−4, 18). Calculemos, também, a altura dessa pirâmide relativa ao vértice P.
Consideremos o paraleleṕıpedo gerado pelos vetores não coplanares
−→
AB,
−→
AC e
−→
AP. (figura abaixo)
v
u
w
Paralelepípedo
Tetraedro
pirâmide de base triangular( )
A
B
C
P
P
A
B
Ch
B
C
A
D
Paralelogramo
base do paralelepípedo( )
v
u
w
A Proposição 2.17 fornece a caracterização geométrica do produto misto: Sejam ~u, ~v e ~w vetores não coplanares.
Então, o volume do paraleleṕıpedo baseado em ~u, ~v e ~w é igual ao módulo do produto misto |~u ·~v× ~w|.
O Corolário 2.3 é consequência dessa caracterização: Sejam ~u, ~v e ~w vetores não coplanares. Então, o volume V
do tetraedro baseado em ~u, ~v e ~w é igual a 1
6
do módulo do produto misto |~u ·~v× ~w|.
No nosso caso, ~u =
−→
AB = B−A = (0, 8, 0), ~v =
−→
AC = C−A = (−4, 6, 0) e ~w =
−→
AP = P −A = (0,−4, 18).
Assim:
V (ABCP) = 1
6
|~u ·~v× ~w| = 1
6
∣∣∣∣∣∣det
 0 8 0−4 6 0
0 −4 18
∣∣∣∣∣∣ = 16 |0+ 0+ 0− 0+ 8.4.18− 0|⇒ V (ABCP) = 96 .
Da Geometria Euclidiana Espacial sabemos que o volume de uma pirâmide é um terço da área da base ABC pela
altura h relativa a esta base.
Quanto à área A do triângulo ABC (base da pirâmide), temos que é dada pela metade da área do paralelogramo
ABCD gerado pelos vetores
−→
AB e
−→
AC (observe que a diagonal BC do paralelogramo ABCD o divide nos triângulos de
mesma área ABC e BCD).
Entretanto, a área do paralelogramo ABCD é, numericamente, o comprimento do vetor produto vetorial
−→
AB×
−→
AC.
Assim:
−→
AB×
−→
AC ≡ det
 ~i ~j ~k0 8 0
−4 6 0
 ≡ (0− 0)~i+ (0− 0)~j+ (0+ 32)~k = (0, 0, 32) .
Logo:
A (ABC) = 1
2
||
−→
AB×
−→
AC|| = 1
2
√
02 + 02 + 322 = 16.
Por fim
V (ABCP) = 1
3
A (ABC) .h⇒ 96 = 1
3
16.h⇒ h = 18 .
é a altura procurada.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 91 de 157 páginas
Caṕıtulo 3
Retas, Planos e Distâncias
Neste caṕıtulo faremos o estudo dos diversos tipos de equações de retas no espaço. Veremos que, ao contrário do
que ocorre com retas no plano cartesiano, o uso de vetores é praticamente obrigatório quando estamos trabalhando
com retas no espaço.
Também faremos a extensão desse estudo de equações para os planos no espaço. O plano é o primeiro tipo de
superf́ıcie no qual é feito um estudo sistemático do ponto de vista anaĺıtico; e veremos que os vetores ajudam muito
nesse processo. No Caṕıtulo ??, de superf́ıcies, página ??, faremos estudos anaĺıticos de outras superf́ıcies muito
importantes como, por exemplo, esferas, cones e cilindros.
Por fim, ainda neste caṕıtulo efetuaremos o importante estudo de distâncias envolvendo pontos, retas e planos no
espaço. Fórmulas para o cálculo de distâncias serão apresentadas em seis posśıveis casos:
• Distância entre dois pontos;
• Distância entre ponto e reta;
• Distância entre ponto e plano;
• Distância entre duas retas;
• Distância entre reta e plano;
• Distância entre dois planos.
3.1 Retas
A Geometria Anaĺıtica tem por principal finalidade associar elementos algébricos, como coordenadas cartesianas
e equações envolvendo coordenadas, a objetos geométricos, como pontos, segmentos e retas, por exemplo. Poder
transferir um problema do campo da geometria para o campo da álgebra é, sem dúvida, um recurso muito interessante.
Não significa que todo problema de geometria possa ser resolvido com álgebra, mas é sempre bom ter mais do que
uma ferramenta matemática à disposição para modelar problemas. É isto que faremos nessa seção com as retas no
espaço. Vamos apresentar quatro tipos de equações de retas associadas às coordenadas cartesianas do espaço. Cada
uma delas tem a sua utilidade e é importante que o leitor saiba identificá-las quando for resolver algum problema.
Como usaremos coordenadas cartesianas a maior parte do tempo, vamos fixar durante toda a seção que Oxyz é
sistema de coordenadas cartesianas ortogonais no espaço com base canônica B = {~i,~j,~k}. Para simplificar, não mais
mencionaremos a base canônica, ficando subentendido que as propriedades operatórias estudadas no Caṕıtulo 2 de
vetores são válidas apenas quando a consideramos.
3.1.1 Equação Vetorial de uma Reta no Espaço
Dado um ponto A no espaço e um vetor ~v 6= ~0, existe uma única reta r no espaço que passa por A e tem mesma
direção de ~v.
Dado um ponto P ∈ r, o vetor
−→
AP é paralelo a ~v. Logo,
−→
AP é proporcional a ~v (Proposição 2.3) e, portanto, existe
λ ∈ R tal que
−→
AP = λ~v.
A
r
v
AP v= l
P
Essas considerações motivam a seguinte definição:
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 92 de 157 páginas UFU GAAL
Dado um ponto A no espaço e um vetor ~v 6= ~0, a equação
−→
AP = λ~v
ou, equivalentemente,
P = A+ λ~v ,
com λ ∈ R, (já que
−→
AP = P −A) é chamada de equação vetorial da reta r que passa por A e tem a direção de ~v.
P é ponto da reta r.
O vetor ~v é chamado de vetor diretor de r (ou seja, o vetor que dá a direção de r) e o número real λ é chamado
de parâmetro da equação vetorial de r.
Observações:
(1) Como podemos notar, partimos de um ponto A e de um vetor ~v 6= ~0 e constrúımos uma reta r e sua equação.
Entretanto, é claro que o procedimento rećıproco vale, ou seja, se partirmos de uma reta r no espaço, podemos tomar
um ponto A ∈ r e um vetor ~v 6= ~0 com a mesma direção de r e escrever a equação vetorial de r, como acima.
(2) Dada uma reta r, sua equação vetorial não é única, pois temos liberdade para escolher A ∈ r e ~v 6= ~0 com a mesma
direção de r.
(3) Dada uma equação vetorial de r, há uma correspondência biuńıvoca entre os pontos de r e os parâmetros λ, ou
seja, para cada ponto de r temos um único valor de λ e vice-versa.
Quando temos coordenadas, podemos transformar uma equação vetorial de reta utilizando ternas ordenadas:
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
Seja P = A+ λ~v, com λ ∈ R, equação vetorial da reta r no espaço.
Fazendo A (x0, y0, z0), P (x, y, z) e ~v = (a, b, c), podemos escrever a equação vetorial de r em coordenadas:
(x, y, z) = (x0, y0, z0) + λ (a, b, c) ,
com λ ∈ R.
Exemplo 3.1 Verifiquemos se as retas r e s dadas pelas equações vetoriais{
(x, y, z) = (1, 1, 0) + λ
(
1, 0,−1
2
)
, λ ∈ R
(x, y, z) =
(
0, 1, 1
2
)
+ µ (−2, 0, 1) , µ ∈ R
são coincidentes, paralelas, concorrentes ou reversas no espaço.
Como os vetores diretores ~v =
(
1, 0,−1
2
)
e ~w = (−2, 0, 1) de r e s, respectivamente, são paralelos (por que?), temos
duas possibilidades: r = s ou r//s.
Se r = s, então deverá existir um ponto em comum a essas retas, ou seja, um ponto P0 (x0, y0, z0) que satisfaça as
duas equações ao mesmo tempo. Isto significa que deverão existir λ0 e µ0 reais tais que{
(x0, y0, z0) = (1, 1, 0) + λ0
(
1, 0,−1
2
)
(x0, y0, z0) =
(
0, 1, 1
2
)
+ µ0 (−2, 0, 1)
⇒ (1, 1, 0) + λ0 (1, 0,−12) = (0, 1, 12)+ µ0 (−2, 0, 1)⇒

1+ λ0 = −2µ0
1 = 1
−λ0
2
= 1
2
+ µ0
Como a 1a. e 3a. equações coincidem (verifique), temos um sistema posśıvel e indeterminado (possui infinitas
soluções), mostrando que, na verdade, r e s possuem infinitos pontos em comum.
Logo, r = s.
3.1.2Equações Paramétricas de uma Reta no Espaço
Dada uma equação vetorial de uma reta r no espaço cartesiano, é possivel colocar cada coordenada de um ponto de r
em função do parâmetro da equação. Este é o conteúdo desenvolvida na próxima definição:
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 93 de 157 páginas
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
Seja r reta de equação vetorial (x, y, z) = (x0, y0, z0) + λ (a, b, c), com λ ∈ R. Logo, podemos escrever x = x0 + λay = y0 + λb
z = z0 + λc
,
que são as chamadas equações paramétricas de r, sendo λ ∈ R o parâmetro das equações paramétricas de r.
Pensando nas equações acima como equações na variável λ, os termos independentes x0, y0 e z0 formam as
coordenadas de um ponto de r, ou seja, A (x0, y0, z0) ∈ r. Já os coeficientes a, b e c formam as coordenadas do vetor
diretor ~v = (a, b, c) de r.
Exemplo 3.2 Os pontos A (3, 6,−7), B (−5, 2, 3) e C (4,−7,−6) formam um triângulo no espaço. Vamos encontrar
as equações paramétricas da reta suporte da mediana do triângulo ABC relativa ao vértice C. Além disso, vamos
verificar se o ponto D (−1, 4, 2) pertence ou não a m.
A reta suporte da mediana relativa ao vértice C do triângulo ABC passa por C e pelo ponto médio M de AB.
Chamemos essa reta de m.
A
BC
M m
Um vetor diretor de m pode ser ~v =
−−→
CM =M− C =
Ä
3+(−5)
2
, 6+2
2
, −7+3
2
ä
− (4,−7,−6) = (−5, 11, 4).
Uma equação vetorial para m pode ser dada por
P = C+ λ~v⇒ (x, y, z) = (4,−7,−6) + λ (−5, 11, 4) , com λ ∈ R.
Portanto, as equações paramétricas de m podem ser escritas como x = 4− 5λy = −7+ 11λ
z = −6+ 4λ
,
sendo λ ∈ R o parâmetro.
Por fim, se D (−1, 4, 2) ∈ m, então deve existir um único λ0 ∈ R associado a D nas equações paramétricas de m.
Vejamos se isso ocorre quando fazemos (x, y, z) = (−1, 4, 2): −1 = 4− 5λ04 = −7+ 11λ0
2 = −6+ 4λ0
⇒
 λ0 = 1λ0 = 1
λ0 = 2
,
ou seja, o sistema de equações é imposśıvel. Logo, D não pertence a m.
3.1.3 Equações Simétricas de uma Reta no Espaço
Quando uma reta r no espaço possui um vetor diretor cujas coordenadas são todas não nulas, é posśıvel escrever
um tipo especial de sistema de equações de r sem que o parâmetro apareça de forma expĺıcita. Este é o conteúdo da
próxima definição.
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
Seja r reta de equação vetorial (x, y, z) = (x0, y0, z0) + λ (a, b, c), com λ ∈ R, e suponhamos que a, b, c 6= 0 (ou
seja, nenhuma coordenada do vetor diretor ~v = (a, b, c) é nula). Das equações paramétricas x = x0 + λay = y0 + λb
z = z0 + λc
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 94 de 157 páginas UFU GAAL
podemos escrever λ = x−x0
a
, λ = y−y0
b
e λ = z−z0
c
, ou seja,
x−x0
a
= y−y0
b
= z−z0
c
que são as chamadas equações simétricas de r.
Observemos que nas equações simétricas da reta r temos x0, y0 e z0 formando as coordenadas de um ponto de r,
ou seja, A (x0, y0, z0) ∈ r. Já os denominadores a, b e c formam as coordenadas do vetor diretor ~v = (a, b, c) de r.
Exemplo 3.3 Verifiquemos se as retas r e s dadas são concorrentes:{
r : x+ 1 = −y+ 4 = z+8
3
s : x−3
2
= −y−1
3
= z−2
4
Observemos que as equações fornecidas são simétricas, mas podemos reescrevê-las de forma mais expĺıcita: r :
x−(−1)
1
= y−4−1 =
z−(−8)
3
s : x−3
2
= y−(−1)−3 =
z−2
4
,
o que significa que A (−1, 4,−8) ∈ r; B (3,−1, 2) ∈ s; ~v = (1,−1, 3) é vetor diretor de r e ~w = (2,−3, 4) é vetor diretor
de s.
Logo, escrever as equações vetoriais de r e s é bem simples:{
r : (x, y, z) = (−1, 4,−8) + λ (1,−1, 3) , com λ ∈ R
s : (x, y, z) = (3,−1, 2) + µ (2,−3, 4) , com µ ∈ R
Para verificar se r e s são concorrentes, uma das formas é encontrar um único ponto P (x0, y0, z0) comum a ambas,
o que significa que devem existir λ0 e µ0 associados a P em cada uma das equações vetoriais acima, ou seja,
(x0, y0, z0) = (−1, 4,−8) + λ0 (1,−1, 3) = (3,−1, 2) + µ0 (2,−3, 4) .
Vejamos se, de fato, existem os parâmetros λ0 e µ0: −1+ λ0 = 3+ 2µ04− λ0 = −1− 3µ0
−8+ 3λ0 = 2+ 4µ0
⇒ · · · (verifique)⇒ λ0 = 2 e µ0 = −1.
Conclusão: (x0, y0, z0) = (−1, 4,−8) + 2 (1,−1, 3) = (1, 2,−2) é o único ponto de intersecção entre r e s.
Portanto, r e s são, de fato, concorrentes.
3.1.4 Equações Reduzidas de uma Reta no Espaço
Quando estudamos equações de retas no plano no Ensino Médio, aprendemos que existem as chamadas “equações
reduzidas”. No espaço elas também existem, mas não na forma de uma única equação para cada reta, mas sim de
um sistema de duas equações reduzidas para cada reta. Além disso, devido ao fato de termos três coordenadas para
cada ponto no espaço, é posśıvel termos três tipos diferentes de sistema de equações reduzidas para uma única reta.
Vejamos como trabalhar esses conceitos.
Seja r reta de equação vetorial (x, y, z) = (x0, y0, z0) + λ (a, b, c), com λ ∈ R, e suponhamos que a 6= 0. Das
equações paramétricas  x = x0 + λay = y0 + λb
z = z0 + λc
podemos isolar λ na primeira equação de substituir na segunda:
y = y0 +
x−x0
a
b⇒ y = b
a
x+ y0 −
x0
a
b.
Escrevendo m = b
a
e n = y0 −
x0
a
b temos
y = mx+ n.
Analogamente, podemos isolar λ na primeira equação e substituir na terceira:
z = z0 +
x−x0
a
c⇒ z = c
a
x+ z0 −
x0
a
c.
Escrevendo p = c
a
e q = z0 −
x0
a
c temos
z = px+ q.
Com base nesse desenvolvimento, consideremos a seguinte definição:
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 95 de 157 páginas
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
Seja r reta no espaço que possua um vetor diretor ~v = (a, b, c) cuja primeira coordenada a (abscissa) não seja
nula.
Nessa condições, vimos que é posśıvel escrever as equações{
y = mx+ n
z = px+ q
,
que são chamadas de equações reduzidas de r na variável x.
É claro que, com o mesmo procedimento, podeŕıamos obter as equações reduzidas de r na variável y (desde
que b 6= 0) e na variável z (desde de que c 6= 0), que são dadas genericamente por{
x = my+ n
z = py+ q
e
{
x = mz+ n
y = pz+ q
.
Observação: As equações reduzidas de r são equações das retas projeções ortogonais de r nos planos coordenados.
Por exemplo: y = mx+ n é a equação da reta que é projeção ortogonal de r no plano coordenado Oxy.
Exemplo 3.4 Afirma-se que as retas
r :
{
x− y− z = 2
x+ y− z = 0
e s :
{
2x− 3y+ z = 5
x+ y− 2z = 0
são paralelas. Isso é verdade?
Primeiramente, observemos que as equações que foram dadas podem ser transformadas em equações reduzidas na
variável x:
r :
{
x− y− z = 2
x+ y− z = 0
≡
{
x− y− z = 2
2x− 2z = 2
≡
{
x− y− z = 2
z = x− 1
≡
{
x− y− (x− 1) = 2
z = x− 1
≡
{
y = −1
z = x− 1
s :
{
2x− 3y+ z = 5
x+ y− 2z = 0
≡
{
2x− 3y+ z = 5
5x− 5z = 0
≡
{
2x− 3y+ z = 5
z = x
≡
{
2x− 3y+ x = 5
z = x
≡
{
y = x− 5/3
z = x
Se r e s forem paralelas, seus vetores diretores também serão paralelos.
Para encontrarmos um vetor diretor para cada uma das retas, basta encontrarmos dois pontos distintos de cada
uma delas. Para fazer isso, atribúımos dois valores distintos de x em cada sistema de equações reduzidas na variável
x das retas r e s. Vejamos:
Fazendo x = 0 em r temos y = −1 e z = −1⇒ A (0,−1,−1) ∈ r.
Fazendo x = 0 em s temos y = −5/3 e z = 0⇒ B (0,−5/3, 0) ∈ s.
Fazendo x = 1 em r temos y = −1 e z = 0⇒ C (1,−1, 0) ∈ r.
Fazendo x = 1 em s temos y = −2/3 e z = 1⇒ D (1,−2/3, 1) ∈ s.
Logo,  ~v =
−→
AC = C−A = (1,−1, 0) − (0,−1,−1) = (1, 0, 1) é vetor diretor de r.
~w =
−→
BD = D− B = (1,−2/3, 1) − (0,−5/3, 0) = (1, 1, 1) é vetor diretor de s.
Como podemos ver, ~v e ~w não são proporcionais, Logo, não são paralelos.
Portanto, a afirmação é falsa e as retas r e s não podem ser paralelase nem coincidentes (elas são concorrentes ou
reversas).
3.1.5 Casos Particulares de Retas no Espaço
Nesta subseção vamos apresentar alguns casos particulares de equações de retas que surgem com certa frequência em
diversos problemas. Basicamente, vamos analisar como são as equações de retas paralelas a planos e eixos coordenados
cartesianos.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 96 de 157 páginas UFU GAAL
Reta paralela a plano coordenado
(1) Se a reta r é paralela ao plano coordenado Oxy, então seus vetores diretores devem ser da forma
~v = (a, b, 0) .
Logo, se r passa por A (x0, y0, z0), então suas equações paramétricas são da forma
r :
 x = x0 + λay = y0 + λb
z = z0
, com λ ∈ R,
r
y
z
x
O
z0
v
v
a
b
A
ou seja, z é sempre constante.
(2) Se a reta r é paralela ao plano coordenado Oxz, então seus vetores diretores devem ser da forma
~v = (a, 0, c) .
Logo, se r passa por A (x0, y0, z0), então suas equações paramétricas são da forma
r :
 x = x0 + λay = y0
z = z0 + λc
, com λ ∈ R,
r
y
z
x
O
a
A
y0
v
v
c
ou seja, y é sempre constante.
(3) Se a reta r é paralela ao plano coordenado Oyz, então seus vetores diretores devem ser da forma
~v = (0, b, c) .
Logo, se r passa por A (x0, y0, z0), então suas equações paramétricas são da forma
r :
 x = x0y = y0 + λb
z = z0 + λc
, com λ ∈ R,
r
y
z
x
A
x0
b
c
O
v
v
ou seja, x é sempre constante.
Exemplo 3.5 Encontremos equações paramétricas das retas:
(a) reta r paralela ao plano coordenado Oxy passando pelos pontos P (1, 2, 3) e P1 (0, 3, 3).
(b) reta s paralela ao plano coordenado Oxz passando pelos pontos P (1, 2, 3) e P2 (0, 2, 2).
(c) reta t paralela ao plano coordenado Oyz passando pelos pontos P (1, 2, 3) e P3 (1, 0, 2).
No Item (a) um vetor diretor de r deve ser da forma ~v = (a, b, 0). Observemos que ~v =
−−→
PP1 = P1 − P = (−1, 1, 0)
cumpre essa condição.
Um ponto fixo de r para escrevermos as equações paramétricas pode ser o próprio ponto P.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 97 de 157 páginas
Logo, as equações paramétricas de r podem ser
r :
 x = 1− λy = 2+ λ
z = 3
, λ ∈ R.
r
y
z
x
3 v
1
3
P
P1
20
No Item (b) um vetor diretor de s deve ser da forma ~v = (a, 0, c). Observemos que ~v =
−−→
PP2 = P2−P = (−1, 0,−1)
cumpre essa condição.
Um ponto fixo de s para escrevermos as equações paramétricas pode ser o próprio ponto P.
Logo, as equações paramétricas de s podem ser
s :
 x = 1− λy = 2
z = 3− λ
, λ ∈ R.
s
y
z
x
v
1 2
0
3 P
P22
No Item (c) um vetor diretor de t deve ser da forma ~v = (0, b, c). Observemos que ~v =
−−→
PP3 = P3 − P = (0,−2,−1)
cumpre essa condição.
Um ponto fixo de t para escrevermos as equações paramétricas pode ser o próprio ponto P.
Logo, as equações paramétricas de t podem ser
t :
 x = 1y = 2− 2λ
z = 3− λ
, λ ∈ R.
y
z
x
v
3
2
20
t
P
P3
Reta paralela a eixo coordenado
(1) Se a reta r é paralela ao eixo coordenado Ox, então seus vetores diretores deverão ser da forma
~v = (a, 0, 0) .
Logo, suas equações paramétricas são da forma
 x = x0 + λay = y0
z = z0
,
r
y
z
x
O
v
v
a
A
z0
y0
ou seja, y e z são sempre constantes (figura abaixo no canto superior esquerdo). Neste caso, as equações reduzidas
de r na variável x são dadas por {
y = y0
z = z0
.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 98 de 157 páginas UFU GAAL
Em particular, o eixo coordenado Ox possui equações reduzidas
{
y = 0
z = 0
.
(2) Se a reta r é paralela ao eixo coordenado Oy, então seus vetores diretores deverão ser da forma
~v = (0, b, 0) .
Logo, suas equações paramétricas são da forma
 x = x0y = y0 + λb
z = z0
,
r
y
z
z0
A
x
x0
O
v
v
b
ou seja, x e z são sempre constantes (figura acima no canto superior direito). Neste caso, as equações reduzidas de
r na variável y são dadas por {
x = x0
z = z0
.
Em particular, o eixo coordenado Oy possui equações reduzidas
{
x = 0
z = 0
.
(3) Se a reta r é paralela ao eixo coordenado Oz, então seus vetores diretores deverão ser da forma
~v = (0, 0, c) .
Logo, suas equações paramétricas são da forma
 x = x0y = y0
z = z0 + λc
,
yy0
r
z
x
x0
O v
v
c
ou seja, x e y são sempre constantes (figura acima na parte inferior). Neste caso, as equações reduzidas de r na
variável z são dadas por {
x = x0
y = y0
.
Em particular, o eixo coordenado Oz possui equações reduzidas
{
x = 0
y = 0
.
Exemplo 3.6 Descrevamos as retas de equações (paramétricas)
r1 :
{
x = 0
z = 0
; r2 :
{
x = 0
y = 0
; r3 :
{
y = 0
z = 0
; r4 :
{
x = 1
z = 2
; r5 :
{
x = 10
y = −1
; r6 :
{
y = 2
z = 5
.
Temos:
Reta r1: eixo coordenado Oy;
Reta r2: eixo coordenado Oz;
Reta r3: eixo coordenado Ox;
Reta r4: reta paralela ao eixo Oy passando por (1, 0, 2); (y pode assumir qualquer valor)
Reta r5: reta paralela ao eixo Oz passando por (10,−1, 0); (z pode assumir qualquer valor)
Reta r6: reta paralela ao eixo Ox passando por (0, 2, 5); (x pode assumir qualquer valor)
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 99 de 157 páginas
3.1.6 Ângulo entre Duas Retas no Espaço
Podemos definir ângulo entre retas do espaço em termos de seus vetores diretores, conforme definição abaixo.
Sejam r1 e r2 retas no espaço com vetores diretores ~v1 e ~v2.
Consideremos os ângulos formados pelos vetores ~v1 e ~v2 e pelos vetores ~v1 e −~v2. O menor desses dois ângulos
é chamado de ângulo entre as retas r1 e r2.
O
v1
v2
q1
v1
q2
-v2
O
v1
v2
A1
r1
r2
A2
Como consequência, retas poderão formar ângulo nulo, agudo ou reto, mas nunca obtuso.
A próxima proposição apresenta uma fórmula para o cálculo da medida de um ângulo entre duas retas utilizando
seus vetores diretores.
Proposição 3.1 Se r1 e r2 são retas no espaço com vetores diretores ~v1 e ~v2, então a medida θ do ângulo formado
pelas retas r1 e r2 é tal que
cos (θ) = |
~v1·~v2|
||~v1||.||~v2||
,
com 0 6 θ 6 π
2
.
Exemplo 3.7 Achemos a medida ( em radianos) do ângulo entre as retas:
(a) r :

x = 3+ λ
y = −2− λ
z =
√
2λ
e s :

x = −2+ λ
y = 3+ λ
z = −5+
√
2λ
.
(b) r :
{
x+2
3
= 3− z
y = 0
e s :
{
x+1
2
= z+ 3
y = 0
.
No Item (a) temos equações paramétricas das retas r e s. Um vetor diretor de r é ~v =
Ä
1,−1,
√
2
ä
e um vetor
diretor de s é ~w =
Ä
1, 1,
√
2
ä
.
De acordo com a Proposição 3.1, se θ é a medida do ângulo entre r e s, temos:
cos (θ) =
|(1,−1,
√
2)·(1,1,
√
2)|»
12+(−1)2+(
√
2)
2
»
12+12+(
√
2)
2
= 2√
4
√
4
= 1
2
⇒ θ = π
3
.
No Item (b) podemos escrever os sistemas de equações na forma reduzida na variável z:
r :
{
x+2
3
= 3− z
y = 0
≡
{
x = −3z+ 7
y = 0
s :
{
x+1
2
= z+ 3
y = 0
≡
{
x = 2z+ 5
y = 0
Fazendo z = 0 em r temos x = 7 e y = 0⇒ A (7, 0, 0) ∈ r.
Fazendo z = 0 em s temos x = 5 e y = 0⇒ B (5, 0, 0) ∈ s.
Fazendo z = 1 em r temos x = 4 e y = 0⇒ C (4, 0, 1) ∈ r.
Fazendo z = 1 em s temos x = 7 e y = 0⇒ D (7, 0, 1) ∈ s.
Logo, {
~v =
−→
AC = C−A = (4, 0, 1) − (7, 0, 0) = (−3, 0, 1) é vetor diretor de r.
~w =
−→
BD = D− B = (7, 0, 1) − (5, 0, 0) = (2, 0, 1) é vetor diretor de s.
De acordo com a Proposição 3.1, se θ é a medida do ângulo entre r e s, temos:
cos (θ) = |(−3,0,1)·(2,0,1)|√
(−3)2+12
√
22+12
= 5√
10
√
5
=
√
2
2
⇒ θ = π
4
.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 100 de 157 páginas UFU GAAL
Retas Ortogonais
Duas retas são ortogonais quando possuem vetores diretores ortogonais.
Observemos que duas retas podem ser ortogonais sem serem concorrentes, ou seja, podem ser ortogonais e reversas.
v1
v2
A1
r1
r2
A2
v3A3
r3
É comum chamar duas retas que são ortogonais e concorrentes de retas perpendiculares.
Exemplo 3.8 Verifiquemos se as retas r e s são ortogonais e, em caso afirmativo, se são também perpendiculares.
r : (x, y, z) = (1, 2, 3) + λ (1, 2, 1) , com λ ∈ R;
s : (x, y, z) = (2, 4, 4) + µ (−1, 1,−1) , com µ ∈ R.
Temos ~v = (1, 2, 1) e ~w = (−1, 1,−1) são vetores diretores de r e s, respectivamente.
Calculando o produto escalar entre os vetores diretores temos ~v · ~w = (1, 2, 1) ·(−1, 1,−1) = 0, ou seja, ~v é ortogonal
a ~w e, portanto, r é ortogonal a s.
Se r for, também, perpendicular a s, deverá existir um ponto P (x0, y0, z0) em comum a r e s. Sejam λ0 e µ0
parâmetros associados a P em r e s. Substituindo (x0, y0, z0) em suas equações temos:
(x0, y0, z0) = (1, 2, 3)+λ0 (1, 2, 1) = (2, 4, 4)+µ0 (−1, 1,−1)⇒
 1+ λ0 = 2− µ02+ 2λ0 = 4+ µ0
3+ λ0 = 4− µ0
⇒ · · · (faça)⇒ λ0 = 1 e µ0 = 0.
Logo, P (2, 4, 4) é ponto de intersecção entre r e s. Portanto, r é perpendicular a s.
Reta Ortogonal a Duas Retas Não Paralelas
Uma reta r pode ser simultaneamente ortogonal a outras duas retas não paralelas r1 e r2. Para encontrarmos um
vetor diretor ~v de r, basta tomarmos o produto vetorial dos vetores diretores ~v1 e ~v2 das retas r1 e r2, respectivamente,
ou seja,
~v = ~v1 ×~v2 ,
v v v=
1 2
´
r
1
r
2
v
1
v
2
r
pois vimos que no produto vetorial, o vetor ~v é, simultaneamente, ortogonal a ~v1 e ~v2.
Observemos que as retas não paralelas r1 e r2 podem ser concorrentes (como na figura acima) ou reversas.
Exemplo 3.9 Dadas as retas r1 e r2 não paralelas{
r1 : (x, y, z) = (0, 0, 1) + λ (2, 3,−4) , com λ ∈ R
r2 : (x, y, z) = (5, 0, 1) + µ (0, 1,−1) , com µ ∈ R
,
achemos uma equação vetorial de uma reta r que passe por A (3, 4,−1) e que seja ortogonal a r1 e a r2 simultaneamente.
Primeiramente, observemos que A /∈ r1 e A /∈ r2.
Temos ~v1 = (2, 3,−4) e ~v2 = (0, 1,−1) vetores diretores de r1 e r2, respectivamente.
O produto vetorial ~v = ~v1 ×~v2 é ortogonal a ~v1 e ~v2 ao mesmo tempo. Logo, pode ser tomado como vetor diretor
de r.
Neste caso, ~v = ~v1 ×~v2 ≡ det
~i ~j ~k2 3 −4
0 1 −1
 ≡ −3~i+ 2~k+ 2~j+ 4~i = (1, 2, 2).
Conclusão:
r : (x, y, z) = (3, 4,−1) + η (1, 2, 2) , com η ∈ R.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 101 de 157 páginas
3.2 Planos
À semelhança do que fizemos com as retas na seção anterior, vamos apresentar três tipos de equações de planos
associadas às coordenadas cartesianas do espaço. Mais uma vez, cada uma delas tem a sua utilidade e é importante
que o leitor saiba identificá-las quando for resolver algum problema.
Continua válida a mesma observação inicial que fizemos no caso das retas: vamos fixar durante toda a seção que
Oxyz é sistema de coordenadas cartesianas ortogonais no espaço.
3.2.1 Equação Vetorial de um Plano no Espaço
Dado um ponto A no espaço e dois vetores não paralelos ~u e ~v, existe um único plano π no espaço que passa por
A e é paralelo a ~u e a ~v simultaneamente.
Dado um ponto P ∈ π, o vetor
−→
AP pode ser escrito como soma de vetores proporcionais a ~u e a ~v, ou seja, existem
λ, µ ∈ R tais que
−→
AP = λ~u+ µ~v.
p
v
u
P
A
lu
mv
AP = +l mu v
Essas considerações motivam a seguinte definição:
Dado um ponto A no espaço e dois vetores não paralelos ~u e ~v, a equação
−→
AP = λ~u+ µ~v ,
ou, equivalentemente,
P = A+ λ~u+ µ~v ,
com λ, µ ∈ R, (já que
−→
AP = P −A) é chamada de equação vetorial do plano π que passa por A e é paralelo a ~u
e ~v simultaneamente.
P é ponto arbitrário de π.
Os vetores ~u e ~v são chamados de vetores diretores de r e os números reais λ e µ são chamados de parâmetros
da equação vetorial de π.
Observações:
(1) Como podemos notar, partimos de um ponto A e de dois vetores ~u e ~v não paralelos e constrúımos um plano π e
sua equação. Entretanto, é claro que o procedimento rećıproco vale, ou seja, se partirmos de um plano π no espaço,
podemos tomar um ponto A ∈ π e dois vetores ~u e ~v não proporcionais mas paralelos a π e escrever a equação vetorial
de π, como acima.
(2) Dado um plano π, sua equação vetorial não é única, pois temos liberdade para escolher A ∈ π e vetores não
paralelos ~u e ~v paralelos a π.
(3) Dada uma equação vetorial de π, há uma correspondência biuńıvoca entre os pontos de π e pares ordenados de
parâmetros (λ, µ), ou seja, para cada ponto de π temos um único par ordenado (λ, µ) e vice-versa.
Quando temos coordenadas, podemos transformar uma equação vetorial de plano utilizando ternas ordenadas:
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
Seja P = A+ λ~u+ µ~v, com λ, µ ∈ R, equação vetorial do plano π no espaço.
Escrevendo A (x0, y0, z0), P (x, y, z), ~u = (a1, b1, c1) e ~v = (a2, b2, c2) podemos escrever a equação vetorial
de π em coordenadas:
(x, y, z) = (x0, y0, z0) + λ (a1, b1, c1) + µ (a2, b2, c2) ,
com λ, µ ∈ R.
Exemplo 3.10 Escrevamos uma equação vetorial para o plano π que passa por A (1, 0, 1) e B (0, 1,−1) e é paralelo
ao segmento CD, sendo C (1, 2, 1) e D (0, 1, 0).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 102 de 157 páginas UFU GAAL
Assim como os pontos C e D, os pontos A e B formam um segmento no espaço e áı vem uma dúvida: Sempre
existe um plano paralelo a dois segmentos dados no espaço?
A resposta é sim. Se os segmentos estiverem em retas concorrentes ou paralelas, é evidente a existência do plano
π. Agora, e se os segmentos estiverem em retas reversas no espaço? Mesmo neste caso, a resposta continua sendo
sim. A prova disso pode ser feita utilizando vetores. Entretanto, se não quiséssemos utilizar vetores, a demonstração
seria um pouco mais dif́ıcil. Em cursos de Geometria Euclidiana Espacial (sem uso de vetores) questões como essa
são abordadas, respondidas e justificadas.
Vamos à equação de nosso exemplo:
Os segmentos AB e CD podem ser utilizados para construirmos os vetores{
~u =
−→
AB = B−A = (0, 1,−1) − (1, 0, 1) = (−1, 1,−2)
~v =
−→
CD = D− C = (0, 1, 0) − (1, 2, 1) = (−1,−1,−1)
,
que não são proporcionais, logo, não são paralelos e podem ser tomados como vetores diretores de um plano π paralelo
a ambos. Como este plano π deve passar por A e por B, podemos utilizar um desses pontos para a construção da
equação vetorial de π:
(x, y, z) = (1, 0, 1) + λ (−1, 1,−2) + µ (−1,−1,−1) , com λ, µ ∈ R.
3.2.2 Equações Paramétricas de um Plano no Espaço
Dada uma equação vetorial de um plano π no espaço cartesiano, é possivel colocar cada coordenada de um ponto
de π em função dos parâmetros da equação. Este é o conteúdo desenvolvida na próxima definição:
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
Seja π com equação vetorial (x, y, z) = (x0, y0, z0) + λ (a1, b1, c1) + µ (a2, b2, c2), com λ, µ ∈ R. Logo, podemos
escrever  x = x0 + λa1 + µa2y = y0 + λb1 + µb2
z = z0 + λc1 + µc2
que são as chamadas equações paramétricas de π, sendo λ, µ ∈ R os parâmetros das equações paramétricas de
π.
Pensando nas equações acima como equações nas variáveis λ e µ, os termos independentes x0, y0 e z0 formam
as coordenadas de um ponto de π, ou seja, A (x0, y0, z0) ∈ π. Já os coeficientes a1, b1, c1, a2, b2 e c2 formam as
coordenadas dos vetores diretores ~u = (a1, b1, c1) e ~v = (a2, b2, c2) de π.
Exemplo 3.11 Escrevamos as equações paramétricas do plano π que encontramos no Exemplo 3.10 logo acima.
Vimos que a equação vetorial do plano π é
(x, y, z) = (1, 0, 1) + λ (−1, 1,−2) + µ (−1,−1,−1) , com λ, µ ∈ R.
Logo, o sistema de equações paramétricas do plano π é dado por: x = 1− λ− µy = λ− µ
z = 1− 2λ− µ
, com λ, µ ∈ R.
3.2.3 Equação Geral de um Plano no Espaço
Há uma terceira forma de equação cartesiana de plano que, sem dúvida, é a mais importante dentre todas as
equaçõesde plano, devido à sua concisão e utilidade em cursos de Cálculo Diferencial e Integral, por exemplo. Trata-
se da equação geral de plano, que passamos a desenvolver abaixo.
Tomemos um ponto A (x0, y0, z0) em um plano π e um vetor ~n = (a, b, c), não nulo, ortogonal a π. Seja P (x, y, z)
um ponto arbitrário de π.
Temos
−→
AP ortogonal a ~n, ou seja,
−→
AP ⊥ ~n, conforme ilustrado na figura abaixo.
n = ( , , )a b c
p
P x( , , )y z
A x( , , )0 y z0 0
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 103 de 157 páginas
De
−→
AP ⊥ ~n temos
−→
AP · ~n = 0, ou seja,
(x− x0, y− y0, z− z0) · (a, b, c) = 0⇒ ax− ax0 + by− by0 + cz− cz0 = 0⇒
ax+ by+ cz+ (−ax0 − by0 − cz0)︸ ︷︷ ︸
=d
= 0⇒ ax+ by+ cz+ d = 0.
Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
A equação
ax+ by+ cz+ d = 0
associada ao plano π tal como desenvolvida acima é chamada de equação geral do plano π.
O vetor ~n = (a, b, c) também é dito vetor normal ao plano π.
Observações:
(1) Observemos que o desenvolvimento acima partiu de um ponto A do plano π, e de um vetor normal ~n a este plano,
e chegou à equação geral do plano π. Entretanto, o procedimento rećıproco também é válido, ou seja, dada uma
equação ax + by + cz + d = 0 nas variáveis x, y e z (isso significa que a, b e c não são todos nulos), esta equação
representa um plano no espaço, que é ortogonal ao vetor ~n não nulo de coordenadas (a, b, c) e as coordenadas de
um ponto A desse plano formam uma terna-raiz da equação ax + by + cz + d = 0, ou seja, A (x0, y0, z0) é tal que
ax0 + by0 + cz0 + d = 0.
(2) Observemos também que, se tivermos a equação vetorial de um plano π, descobrir um vetor normal ~n a π para
escrever sua equação geral é muito simples: basta calcular o produto vetorial
~n = ~u×~v ,
sendo ~u e ~v os vetores diretores de π na equação vetorial. A justificativa é óbvia, pois ~u e ~v são paralelos a π e o
produto vetorial ~n é ortogonal a ~u e a ~v simultaneamente. Portanto, ~n é ortogonal a π.
(2) Por fim, um modo ainda mais fácil de encontrar a equação geral de um plano π, se tivermos a equação vetorial.
Se A ∈ π é dado, P ∈ π é um ponto arbitrário e, ~u e ~v são vetores diretores de π, então os três vetores:
−→
AP, ~u e ~v são
colineares. Isto siginifica que seu produto misto é zero! Logo, é muito fácil encontrar a equação geral. Vejamos um
exemplo.
Exemplo 3.12 Vamos encontrar a equação geral do plano π do Exemplo 3.10 acima.
Vimos que a equação vetorial do plano π é
(x, y, z) = (1, 0, 1) + λ (−1, 1,−2) + µ (−1,−1,−1) , com λ, µ ∈ R.
Fazendo A (1, 0, 1), ~u = (−1, 1,−2) e ~v = (−1,−1,−1), chamemos de P (x, y, z) um ponto arbitrário de π. Logo,
−→
AP = P −A = (x, y, z) − (1, 0, 1) = (x− 1, y, z− 1).
Como os vetores
−→
AP, ~u e ~v são coplanares, seu produto misto é zero, ou seja,
−→
AP · ~u×~v = 0. Assim,
det
x− 1 y z− 1−1 1 −2
−1 −1 −1
 = 0⇒ −(x− 1) + 2y+ z− 1+ z− 1− y− 2 (x− 1) = 0⇒ −3x+ y+ 2z+ 1 = 0
é a equação procurada.
3.2.4 Ângulo entre Reta e Plano no Espaço
Podemos trabalhar com ângulos entre retas e planos no espaço. Para tanto, segue a definição necessária para esse
estudo:
Sejam r reta com vetor diretor ~v e π plano com vetor normal ~n no espaço.
Consideremos os ângulos formados pelos vetores ~v e ~n e pelos vetores ~v e −~n. O complemento (1) do menor
desses dois ângulos é chamado de ângulo entre a reta r e o plano π.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 104 de 157 páginas UFU GAAL
n
p
r
r¢q
-n
v
n
Como consequência, reta e plano poderão formar ângulo nulo, agudo ou reto, mas nunca obtuso.
Quando o vetor diretor ~v da reta r e o vetor normal ~n do plano π são paralelos, dizemos que a reta r e o plano π
são perpendiculares ou ortogonais. Neste caso, o complemento citado acima é um ângulo reto.
Observemos também que, se a reta r e o plano π não forem ortogonais, o ângulo entre r e π é o mesmo que o
ângulo formado por r e r′ = projπ r. (r
′ é a projeção ortogonal da reta r sobre o plano π). A figura acima ilustra essa
situação.
Por fim, outra forma alternativa de se definir o ângulo entre uma reta e um plano é considerá-lo como sendo o
complemento do ângulo entre as retas r e n, de vetores diretores ~v e ~n, respectivamente. Novamente, isso pode ser
vista na figura acima.
Uma vez definido o ângulo entre uma reta e um plano, resta verificarmos como calcular a medida desse ângulo em
função dos vetores envolvidos. Este é o próximo resultado matemático, enunciado abaixo:
Proposição 3.2 Se r é uma reta com vetor diretor ~v e π é um plano com vetor normal ~n, então a medida θ do ângulo
formado pela reta r e o plano π é tal que
sen (θ) = |
~v·~n|
||~v||.||~n|| ,
com 0 6 θ 6 π
2
.
Demonstração.
Consideremos o ângulo de medida θ entre a reta r e o plano π e o ângulo de medida α entre as retas r e n
(normal ao plano π).
De acordo com o que foi definido e observado acima, temos θ+ α = π
2
.
Mas vimos que o ângulo de medida α entre as retas é tal que cos (α) = |
~v·~n|
||~v||.||~n|| (Proposição 3.1).
Assim,
cos (α) = |
~v·~n|
||~v||.||~n|| ⇒ cos (π2 − θ) = |~v·~n|||~v||.||~n|| ⇒
cos
(
π
2
)
cos (θ) + sen
(
π
2
)
sen (θ) = |
~v·~n|
||~v||.||~n|| ⇒ sen (θ) = |~v·~n|||~v||.||~n|| ,
como queŕıamos. �
Exemplo 3.13 Achemos a medida do ângulo entre:
(a) r :
{
x = 0
y = z
e π : z = 0. (b) r :
{
x+ y = 2
x = 1+ 2z
e π :
»
45
7
x+ y+ 2z− 10 = 0.
No caso (a) nem é preciso fórmula, pois r :
{
x = 0
y = z
é bissetriz de quadrantes ı́mpares do plano coordenado Oyz
e o plano π : z = 0 é o plano coordenado Oxy. Logo, o ângulo entre r e π mede π
4
rad, ou seja, 45◦.
Mas vamos verificar esse resultado com a fórmula deduzida na Proposição 3.2.
Um vetor diretor de r pode ser obtido por meio dos pontos que correspondem a z = 0 e z = 1 (por exemplo) nas
equações reduzidas de r, ou seja, ~v = (0, 1, 1) − (0, 0, 0) = (0, 1, 1).
Um vetor normal a π pode ser obtido por meio dos coeficientes das variáveis x, y e z na equação geral de π, ou
seja, ~n = (0, 0, 1).
Logo, se θ é a medida do ângulo entre r e π, então:
sen (θ) = |
~v·~n|
||~v||.||~n|| =
|(0,1,1)·(0,0,1)|√
02+12+12
√
02+02+12
=
√
2
2
⇒ θ = π
4
rad .
1Dois ângulos de medidas α e β são ditos complementares (ou um dos ângulo é o complemento do outro) quando α + β = 90◦ (ou
α + β = π
2
rad).
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 105 de 157 páginas
No caso (b) o procedimento é análogo, observando apenas que as equações de r são reduzidas na variável x:
r :
{
x+ y = 2
x = 1+ 2z
≡
{
y = −x+ 2
z = 1
2
x− 1
2
Vetor diretor de r : ~v = (1, 1, 0) −
(
0, 2,−1
2
)
=
(
1,−1, 1
2
)
.
Vetor normal a π : ~n =
(»
45
7
, 1, 2
)
.
Logo,
sen (θ) =
∣∣∣(1,−1, 12 )·(»457 ,1,2)∣∣∣
√
1+1+ 1
4
»
45
7
+1+4
=
»
45
7
−1+1
3
2
»
80
7
= 2
√
32.5
3
√
425
= 2.3
3.4
= 1
2
⇒ θ = π
6
rad .
3.2.5 Ângulo entre Dois Planos no Espaço
Além do conceito de ângulo entre reta e plano, também temos o conceito de ângulo ente planos, que passamos a
definir abaixo:
Sejam π1 e π2 planos no espaço com vetores normais ~n1 e ~n2.
Consideremos os ângulos formados pelos vetores ~n1 e ~n2 e pelos vetores ~n1 e −~n2. O menor desses dois ângulos
é chamado de ângulo entre os planos π1 e π2.
Observemos que essa é a mesma definição do ângulo entre as retas normais n1 e n2 a π1 e π2, de vetores diretores
~n1 e ~n2, respectivamente.
n1
q
q
q
n2
n1
n2
-n2
p1
p2
Como consequência, planos poderão formar ângulo nulo, agudo ou reto, mas nunca obtuso.
Além disso, a fórmula para cálculo da medida θ do ângulo entre dois planos é mesma fórmula utilizada para o
cálculo da medida do ângulo entre duas retas:
cos (θ) = |
~n1·~n2|
||~n1||.||~n2||,
com 0 6 θ 6 π
2
.
Exemplo 3.14 Achemos a medida do ângulo entre o planos
π1 : X = (0, 0, 0) + λ (1, 0, 0) + µ (1, 1, 1) e π2 : X = (1, 0, 0) + λ (−1, 2, 0) + µ (0, 1, 0) .
Basta encontrarmos vetores normais ao planos e calcularmos a medida do ângulo entre eles.
Chamando os vetores diretores de π1 de ~u1 = (1, 0, 0).e ~u2 = (1, 1, 1) e, os vetores diretores de π2 de ~v1 = (−1, 2, 0)
e ~v2 = (0, 1, 0), temos:
Vetor normal a π1 : ~n1 = ~u1 × ~u2 ≡ det
~i ~j ~k1 0 0
1 1 1
 ≡ −~j+ ~k = (0,−1, 1).
Vetor normal a π2 : ~n2 = ~v1 ×~v2 ≡ det
 ~i ~j ~k−1 2 0
0 1 0
 ≡ −~k = (0, 0,−1).
Logo, se θ é a medida do ângulo entre os planos, então:
cos (θ) = |
~n1·~n2|
||~n1||.||~n2||
= |(0,−1,1)·(0,0,−1)|√
2
√
1
=
√
2
2
⇒ θ = π
4
rad .
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 106 de 157 páginas UFU GAAL
Uma observação importante sobre equações de retas e planos concorrentes.
Na seção anterior estudamos as equações das retas no espaço. Além das quatro formas de equações apresentadas,
há ainda um outro modo de apresentar uma equação de reta no espaço: como intersecção de dois planos concorrentes.
Assim, quando escrevemos
r :
{
a1x+ b1y+ c1z+ d1 = 0
a2x+ b2y+ c2z+ d2 = 0
,
estamos pensando na reta r que é intersecção dos planos concorrentes π1 e π2 cujas equações gerais são dadas acima.
Observe que esta forma de apresentar uma reta pode não coincidir com aquelas que estudamos na seção anterior.
Por outro lado, quando apresentamos um sistema de equações reduzidas (não importa em qual variável), sempre
podemos pensar naquelas duas equações como equações de planos e a reta r é, portanto, fruto de uma intersecção
de planos. O mesmo pode ser pensado das equações simétricas de uma reta r: escolhendo-se duas das equações (das
três equações dispońıveis) elas podem ser pensadas como equações de planos e a reta r é, novamente, fruto de uma
intersecção de planos.
Por fim, um cuidado especial quando apresentamos uma reta r com equações que se parecem com equações
simétricas, como, por exemplo, x− z = y− 1 = 0. Aqui, mais uma vez, podemos escolher duas das equações (dentre
as três dispońıveis) e enxergar r como intersecção de dois planos concorrentes. Podemos escrever
r :
{
x− z = 0
y− 1 = 0
, r :
{
x− z = y− 1
y− 1 = 0
ou, ainda, r :
{
x− z = 0
x− z = y− 1
.
Todas essas formas de apresentação referem-se à mesma reta r.
3.3 Distâncias
Todas as noções de distância entre pontos, retas e planos que são estudadas nesta seção são, na verdade, provenientes
de apenas uma única noção: a de que a distância entre dois desses objetos no espaço, digamos F1 e F2, é a menor
distância que se pode obter entre um ponto de F1 e um ponto de F2.
Vamos apresentar seis casos que nos interessam em termos de distâncias e suas respectivas fórmulas envolvendo
vetores:
• Distância entre dois pontos;
• Distância entre ponto e reta;
• Distância entre ponto e plano;
• Distância entre duas retas;
• Distância entre reta e plano;
• Distância entre dois planos.
Mais uma vez, é sempre bom recordar que estamos fixando Oxyz sistema de coordenadas cartesianas ortogonais
no espaço.
3.3.1 Distância de Ponto a Ponto
A distância entre dois pontos no espaço pode ser calculada como sendo o comprimento do segmento de reta que
liga esses dois pontos, ou então, como sendo o comprimento do vetor com origem e extremo nesses pontos. Esse é o
conteúdo da próxima definição.
Dados dois pontos P e Q no espaço, definimos a distância entre os pontos P e Q, indicada por d (P,Q), como
sendo o comprimento do segmento de reta com extremos em P e Q, o que equivale dizer que a distância entre P e
Q é o comprimento do vetor
−→
PQ ou
−→
QP.
Como já vimos o cálculo do comprimento de um vetor utilizando suas coordenadas, então a fórmula de distância
entre dois pontos fica extremamente fácil. Vamos recordá-la na proposição abaixo.
Proposição 3.3 Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
Se P (x1, y1, z1) e Q (x2, y2, z2), então a distância entre P e Q é dada por
d (P,Q) = ||
−→
PQ|| =
»
(x2 − x1)
2
+ (y2 − y1)
2
+ (z2 − z1)
2 .
Obviamente, se P = Q, então d (P,Q) = 0.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 107 de 157 páginas
Exemplo 3.15 Achemos os pontos da reta r :
{
x+ y = 2
x = y+ z
que distam 3 do ponto Q (0, 2, 1).
Observemos que a reta r foi dada como intersecção dos planos concorrentes π1 e π2, de equações gerais x+y−2 = 0
e x− y− z = 0, respectivamente.
Um ponto P (x0, y0, z0) de r possui expressão
P (x0, 2− x0, x0 − y0) = P (x0, 2− x0, x0 − (2− x0)) = P (x0, 2− x0, 2x0 − 2) .
Assim,
−→
PQ = Q− P = (0, 2, 1) − (x0, 2− x0, 2x0 − 2) = (−x0, x0,−2x0 + 3).
Logo,
d (P,Q) = 3⇒ ||−→PQ|| = 3⇒»(−x0)2 + x20 + (−2x0 + 3)2 = 3⇒
2x20 + 4x
2
0 − 12x0 + 9 = 9⇒ x0 (6x0 − 12) = 0⇒ x0 = 0 ou x0 = 2.
Portanto, há dois pontos que satisfazem o enunciado: P1 (0, 2,−2) e P2 (2, 0, 2).
3.3.2 Distância de Ponto a Reta
Dado um ponto e P uma reta r no espaço, dentre todos os segmentos de reta que ligam P a um ponto de r, qual é o
de menor comprimento? É fácil perceber que é aquele perpendicular à reta. E isso é fácil de ser justificado utilizando
o Teorema de Pitágoras (tente fazer isso). Essa é a motivação para a seguinte definição:
Dados o ponto P e a reta r no espaço, definimos a distância do ponto P à reta r, indicada por d (P, r), como
sendo o comprimento do segmento de reta PQ perpendicular a r baixado a partir de P, com Q ∈ r, ou seja,
d (P, r) = d (P,Q).
Obviamente, se P ∈ r, então d (P, r) = 0.
r
P
d P r( , ) = d P Q( , )
Q
A próxima proposição fornece uma fórmula para o cálculo de distância de ponto a reta utilizando um vetor diretor
da reta. Sua demonstração é simples e faz uso da interpretação geométrica do produto vetorial. Convidamos o leitor
a tentar demonstrá-la.
Proposição 3.4 Sejam P ponto e r reta com vetor diretor ~v no espaço. Então,
d (P, r) = ||
−→
AP×~v||
||~v|| ,
sendo A um ponto qualquer de r.
Observemos que se P ∈ r, então
−→
AP//~v e, portanto,
−→
AP × ~v = ~0, ou seja, d (P, r) = 0. Notemos que, neste caso, A
pode ser inclusive igual a P!
Exemplo 3.16 Achemos os pontos da reta r :
{
x+ y = 2
x = y+ z
que distam
»
14
3
da reta s : x = y = z+ 1.
Como vimos no Exemplo 3.15, um ponto P (x0, y0, z0) de r possui expressão P (x0, 2− x0, 2x0 − 2).
Sejam A (0, 0,−1) ∈ s (um ponto escolhido de s) e ~v = (1, 1, 1) vetor diretor de s (lembre-se que as equações de s
são simétricas e os denominadores formam as coordenadas de um vetor diretor de s).
Temos
−→
AP = P −A = (x0, 2− x0, 2x0 − 2) − (0, 0,−1) = (x0, 2− x0, 2x0 − 1) e
−→
AP×~v ≡ det
 ~i ~j ~kx0 2− x0 2x0 − 1
1 1 1
 ≡ (2− x0 − (2x0 − 1) , 2x0 − 1− x0, x0 − (2− x0)) = (−3x0 + 3, x0 − 1, 2x0 − 2) .
Logo,
d (P, s) =
»
14
3
⇒ ||−→AP×~v||
||~u|| =
»
14
3
⇒ √(−3x0+3)2+(x0−1)2+(2x0−2)2√
3
=
√
14√
3
⇒
9x20 − 18x0 + 9+ x
2
0 − 2x0 + 1+ 4x
2
0 − 8x0 + 4 = 14⇒ 14x20 − 28x0 = 0⇒ x0 (x0 − 2) = 0⇒ x0 = 0 ou x0 = 2.
Logo, há dois pontos que satisfazem o enunciado: P1 (0, 2,−2) e P2 (2, 0, 2).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 108 de 157 páginas UFU GAAL
3.3.3 Distância de Ponto a Plano
Aqui a ideia é a mesma daquela que citamos no caso de distância de ponto a reta. Seja P um ponto e π um plano
no espaço. Dentre todos os segmentos de reta que ligam P a um ponto de π, qual é o de menor comprimento? É fácil
ver que é aquele perpendicular ao plano π (e, mais uma vez, o Teorema de Pitágoras justifica isso). Sendo assim, a
definição abaixo fica natural:
Dados o ponto P e o plano π no espaço, definimos a distância do ponto P ao plano π, indicada por d (P, π),
como sendo o comprimento do segmento de reta PQ perpendiculara π baixado a partir de P, com Q ∈ π, ou seja,
d (P, π) = d (P,Q).
Obviamente, se P ∈ π, então d (P, π) = 0.
P
Q
p
d P( , ) =p d P Q( , )
A próxima proposição fornece uma fórmula para o cálculo de distância de ponto a plano utilizando vetores diretores
do plano. Sua demonstração faz uso da interpretação geométrica do produto misto e, embora seja um pouco dif́ıcil de
se ilustrar com uma figura, convidamos o leitor a tentar demonstrá-la.
Proposição 3.5 Sejam P ponto e π plano com vetores diretores ~u e ~v no espaço. Então,
d (P, π) = |
−→
AP·~u×~v|
||~u×~v|| ,
sendo A um ponto qualquer de π.
Observemos que se P ∈ π, então
−→
AP, ~u e ~v são coplanares e, portanto,
−→
AP ·~u×~v = 0, ou seja, d (P, π) = 0. Notemos
que, neste caso, A pode ser inclusive igual a P!
Exemplo 3.17 Calculemos a distância do ponto P (1, 2, 3) ao plano π de equação vetorial (x, y, z) = (1, 1, 1) +
λ (1, 0, 2) + µ (2, 0, 1), com λ, µ ∈ R.
Um ponto A do plano π pode ser escolhido como sendo A (1, 1, 1). Logo,
−→
AP = P−A = (1, 2, 3)−(1, 1, 1) = (0, 1, 2).
Fazendo ~u = (1, 0, 2) e ~v = (2, 0, 1) temos:
~u×~v ≡ det
~i ~j ~k1 0 2
2 0 1
 ≡ (0, 3, 0) .
Logo,
d (P, π) = |
−→
AP·~u×~v|
||~u×~v|| =
|(0,1,2)·(0,3,0)|
||(0,3,0)|| =
3
3
= 1.
Embora a proposição acima seja interessante, frequentemente o plano π é fornecido por meio de sua equação geral.
Sendo assim, seria bom se deduźıssemos uma fórmula que faça uso dos elementos da equação geral do plano ao invés
dos vetores diretores. Esse é o conteúdo da próxima proposição.
Proposição 3.6 Seja Oxyz sistema de coordenadas cartesianas ortogonais no espaço. Sejam P (x0, y0, z0) ponto e π
plano no espaço com equação geral ax+ by+ cz+ d = 0. Então,
d (P, π) = |ax0+by0+cz0+d|√
a2+b2+c2
.
Observação: Lembremos que ~n = (a, b, c) é vetor normal ao plano π. Logo, podemos fazer a intersecção da reta r
que passa por P e é perpendicular a π (a equação vetorial de r pode ser dada por X = P + λ~n, com λ ∈ R) com o
próprio plano π. Com esse procedimento podemos encontrar o ponto {Q} = r ∩ π. A distância de P a π coincide com
a distância de P a Q, ou seja, d (P, π) = d (P,Q), conforme podemos observar na figura abaixo.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 109 de 157 páginas
P
Q
p
r
n
d P( , ) =p d P Q( , )
n
Exemplo 3.18 Achemos os pontos da reta r :
{
x+ y = 2
x = y+ z
que distam
√
6 do plano π : x− 2y− z = 1.
Como vimos no Exemplo 3.15, um ponto P (x0, y0, z0) de r possui expressão P (x0, 2− x0, 2x0 − 2).
Da equação geral do plano π temos a = 1, b = −2, c = −1 e d = −1. Logo,
d (P, π) =
√
6⇒ |1.x0+(−2)(2−x0)+(−1)(2x0−2)+(−1)|
||(1,−2,−1)|| =
√
6⇒ |x0−4+2x0−2x0+2−1|√
1+4+1
=
√
6⇒ |x0−3|√
6
=
√
6⇒ x0 − 3 = 6ou
x0 − 3 = −6
⇒ x0 = 9 ou x0 = −3.
Logo, há dois pontos que satisfazem o enunciado: P1 (9,−7, 16) e P2 (−3, 5,−8).
3.3.4 Distância de Reta a Reta
Para definir distância entre duas retas no espaço temos três situações a serem consideradas:
• Retas concorrentes;
• Retas paralelas;
• Retas reversas (ou seja, não coplanares).
As duas primeiras situações são bastante simples, porém, a terceira não é. Para tornar as definições que apresenta-
remos mais naturais, o leitor sempre deve ter em mente o conceito de distância entre dois objetos que já mencionamos
no ińıcio desta seção: o comprimento do menor segmento que liga um ponto de uma reta a um ponto da outra reta.
Antes das definições, um resultado de Geometria Euclidiana Espacial envolvendo retas reversas: Quando r e s são
reversas é posśıvel mostrar que existe, e é único, o plano π paralelo à reta r e que contém a reta s. A demonstração
pode ser feita com vetores (mais fácil) ou sem vetores (mais dif́ıcil). Não a faremos aqui, mas encorajamos o leitor
para que tente fazê-la. Vamos admitir esse resultado na definição abaixo.
Sejam r e s retas distintas no espaço. Temos três situações a serem consideradas:
(1) Quando r e s são concorrentes, definimos a distância entre as retas r e s como sendo nula, ou seja, d (r, s) = 0.
(2) Quando r e s são paralelas, definimos a distância entre as retas r e s como sendo a distância de um ponto P
qualquer de r até s, e o problema do cálculo da distância entre r e s recai sobre o problema da distância de ponto a
reta que já estudamos, ou seja, d (r, s) = d (P, s).
(3) Quando r e s são reversas, definimos a distância entre as retas r e s como sendo a distância de um ponto P
qualquer da reta r até o plano π, que contém a reta s e é paralelo à reta r.
rP
d r s( , ) = d P s( , )
s
retas paralelas
r
s
p
d r s( , ) = d P( , )p
r
s
P
retas reversas
Quando r e s são reversas, observemos que se ~u e ~v são vetores diretores de r e s, respectivamente, podemos
escrever a equação vetorial do plano π da definição utilizando os vetores ~u e ~v como sendo vetores diretores de π.
Logo, o cálculo da distância entre r e s pode ser feito utilizando-se o cálculo da distância de um ponto P qualquer de
r ao plano π, conforme já visto. Vamos sintetizar essa observação na proposição abaixo.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 110 de 157 páginas UFU GAAL
Proposição 3.7 Sejam r e s retas concorrentes ou reversas com vetores diretores ~u e ~v. Então,
d (r, s) = |
−→
PQ·~u×~v|
||~u×~v|| ,
sendo P ∈ r e Q ∈ s pontos quaisquer.
Observações:
(1) Na proposição acima, embora estejamos interessados em retas reversas, inclúımos na hipótese a possibilidade de
r e s serem concorrentes. Isto não causa problema algum pois, neste caso, os vetores
−→
PQ, ~u e ~v serão coplanares e,
portanto, o produto misto é zero, que é a distância entre retas concorrentes.
(2) O cálculo do produto vetorial ~u×~v é bastante útil para identificar a posição relativa das retas r e s no espaço:
(2i) Se ~u × ~v = ~0, então as retas r e s são paralelas ou coincidentes (isto é r = s). Neste caso, para saber se r
e s são distintas ou não, basta procurar por algum ponto comum às duas retas. Se este ponto existir, as retas são
coincidentes, caso contrário, as retas são paralelas.
(2ii) Se ~u × ~v 6= ~0, então as retas r e s são concorrentes ou reversas e podemos utilizar a proposição acima.
Observemos ainda que se r e s são concorrentes, então os vetores
−→
PQ, ~u e ~v são coplanares e, conforme observado
acima, o produto misto
−→
PQ · ~u×~v é nulo.
Curiosidade: E aquela história do comprimento do menor segmento que liga um ponto de uma reta r a um ponto
de outra reta s, ser a distância entre r e s? Como enxergamos isso no caso das retas r e s serem reversas?
Dadas duas retas reversas r e s, é posśıvel provar que sempre existe um segmento de reta AB perpendicular a r
e a s ao mesmo tempo. A distância entre r e s coincide com o comprimento de AB, ou seja, d (r, s) = d (A,B) e,
conforme a figura abaixo sugere, AB é o segmento de menor comprimento ligando um ponto de r a um ponto de s.
p
d r s( , ) = d A B( , )
r
s
A
B
Exemplo 3.19 Calculemos a distância entre as retas r :
{
x+ y = 2
x = y+ z
e s : x = y = z+ 1 do Exemplo 3.16.
Precisamos de um vetor diretor de r. Para economizar, tomemos ~u =
−−−→
P1P2, sendo P1 (0, 2,−2) e P2 (2, 0, 2) os
pontos de r que encontramos no próprio Exemplo 3.16, ou seja, ~u = (2, 0, 2) − (0, 2,−2) = (2,−2, 4).
Um vetor diretor de s pode ser ~v = (1, 1, 1).
Assim:
~u×~v ≡ det
~i ~j ~k2 −2 4
1 1 1
 ≡ (−6, 2, 4) .
Um ponto de r pode ser P1 (0, 2,−2). Um ponto de s pode ser Q (1, 1, 0). Logo,
−−→
P1Q = (1, 1, 0) − (0, 2,−2) =
(1,−1, 2).
Assim,
d (r, s) = |
−−→
P1Q·~u×~v|
||~u×~v|| =
|(1,−1,2)·(−6,2,4)|
||(−6,2,4)|| =
|−6−2+8|√
36+4+16
= 0.
Isto significa que r e s são, na verdade, retas concorrentes!
Não é dif́ıcil calcular o ponto de intersecção entre r e s, que é o próprio Q (1, 1, 0) que escolhemos acima (verifique).3.3.5 Distância de Reta a Plano
Para definirmos a distância de reta a plano temos, também, três situações posśıveis:
• Reta contida em plano;
• Reta e plano concorrentes;
• Reta paralela a plano.
Em qualquer caso, a definição é bem simples e intuitiva, conforme podemos constatar abaixo.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 111 de 157 páginas
Sejam r reta e π plano no espaço. Temos três situações a serem consideradas:
(1) Quando r ⊂ π, definimos a distância entre a reta r e o plano π como sendo nula, ou seja, d (r, π) = 0.
(2) Quando r e π são concorrentes, definimos a distância entre a reta r e o plano π como sendo, também, nula,
ou seja, d (r, π) = 0.
(3) Quando r é paralela a π, definimos a distância entre a reta r e o plano π como sendo a distância de um ponto
P qualquer da reta r até o plano π, ou seja, d (r, π) = d (P, π)
A figura abaixo ilustra cada uma das situações descritas na definição.
r
pp
d r( , ) =p 0
P
r
r P
p
d r( , ) =p d P( , )pd r( , ) =p 0
Observemos que neste caso, não há novas fórmulas de distância a serem deduzidas.
3.3.6 Distância de Plano a Plano
Por fim, distância entre planos no espaço. Neste último caso não há novidades: temos duas situações bastante
simples a serem consideradas:
• Planos concorrentes;
• Planos paralelos.
Vamos à definição:
Sejam π1 e π2 planos distintos no espaço. Temos duas situações a serem consideradas:
(1) Quando π1 e π2 são concorrentes, definimos a distância entre π1 e π2 como sendo nula, ou seja, d (π1, π2) = 0.
(2) Quando π1 e π2 são paralelos (π1//π2), definimos a distância entre os planos π1 e π2 como sendo a distância
de um ponto P qualquer do plano π1 ao plano π2, ou seja, d (π1, π2) = d (P, π2).
A figura abaixo ilustra cada uma das duas situações descritas.
r
p1
d( , ) =p p1 2 0
P
p2
p2
d( , ) =p p p1 2 2d P( , )
p1
Também não há novas fórmulas de distância a serem deduzidas nesses casos.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
GAAL UFU Página 163 de 277 páginas
Caṕıtulo 4
Curvas
Neste caṕıtulo começamos o estudo de uma famı́lia muito especial de curvas, as chamadas curvas cônicas. Do
ponto de vista matemático, uma ideia intuitiva e simples (mas não precisa) de curva é a de uma linha, na qual é
posśıvel medir comprimentos. Não iremos definir formalmente o que se entende por curva de um modo geral, pois
para isso seriam necessários conhecimentos matemáticos um pouco mais avançados do que aqueles que prentendemos
abordar nessas notas.
Uma curva pode ser plana, quando existe um plano que a contém, ou espacial, caso contrário. Dentre todas as
curvas planas há uma famı́lia que merece destaque: são as chamadas curvas cônicas que passamos a descrever e estudar
nas próximas seções.
Assim como nos caṕıtulos anteriores, ao final deste caṕıtulo há três seções de exerćıcios. A primeira delas (página
196) possui exerćıcios propostos e resolvidos, é oriunda do “Projeto Prossiga de Geometria Anaĺıtica” e é parte
complementar da teoria (portanto, faça!). A segunda seção é de exerćıcios resolvidos (página 211) e é um “extra”.
A terceira seção, também “extra”, é de exerćıcios propostos (página 217).
4.1 Curvas Cônicas: secções cônicas
As chamadas curvas cônicas possuem esse nome porque podem ser concebidas como intersecção de um plano com
um cone.
Associado à história das curvas cônicas, temos o nome de Apolônio, que nasceu na cidade de Perga, região da
Panf́ılia (atualmente Turquia) por volta de 262 a.C. e viveu, aproximadamente, até 190 a.C. Apolônio foi contem-
porâneo de Arquimedes, de Siracusa, que viveu, aproximadamente, entre 287 a.C. e 212 a.C. e, juntamente com
Euclides, de Alexandria, (aprox. 325 a.C. a 265 a.C.) formam a tŕıade considerada como sendo a dos maiores ma-
temáticos gregos da antiguidade. Apolônio estudou com os disćıpulos de Euclides, em Alexandria, e foi astrônomo
notável. Sua obra prima intitula-se Secções Cônicas e é composta por 8 volumes (aproximadamente 400 pro-
posições!). Da obra original sobreviveram 7 volumes, sendo 4 escritos em grego e 3 traduzidos para o árabe por Thabit
Ibn Qurra (826 a 901) no século IX. Os três primeiros volumes são baseados em trabalhos de Euclides e o oitavo vo-
lume foi, infelizmente, perdido. Em 1710, o astrônomo Edmond Halley (1) traduziu os sete volumes sobreviventes de
Secções Cônicas para o latim e todas as demais traduções para as ĺınguas modernas foram feitas a partir da tradução
de Halley.
Apolônio de Perga, 262 a 190 a.C.
Apolônio escreveu pelo menos mais seis outras obras que, infelizmente, se perderam, com exceção de uma (que foi
traduzida para o árabe na Idade Média). No entanto, ao contrário do oitavo volume de Secções Cônicas, essas cinco
obras perdidas foram restauradas no século XVIII a partir de citações e comentários em obras gregas antigas.
Embora Apolônio tenha sido o matemático que mais estudou e desenvolveu as cônicas na antiguidade, essas curvas
já eram conhecidas em sua época, sendo os precursores Manaecmo, Aristeu e o próprio Euclides.
1Que dá nome ao famoso “Cometa Halley” que visita os arredores da Terra de 76 em 76 anos (aproximadamente). Sua última aparição
foi em 1986.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 164 de 277 páginas UFU GAAL
Antes de Apolônio, as curvas cônicas eram concebidas como intersecções de cones circulares simples (de uma folha
apenas) com planos perpendiculares a uma das semirretas geratrizes do cone. Uma tal intersecção é uma curva plana
chamada:
(1) Elipse: quando o ângulo de abertura do cone é agudo. (2)
(2) Parábola: quando o ângulo de abertura do cone é reto.
(3) Hipérbole: quando o ângulo de abertura do cone é obtuso. (3)
parábola
qq
elipse
q retoq agudo
qhipérbole
q obtuso
Com Apolônio, ao invés de se considerar três cones simples para obtermos os três tipos de curvas acima mencionadas,
tomamos um único cone circular, mas duplo, e fazemos a intersecção com planos de diferentes inclinações. É este
desenvolvimento, proposto nas obras de Apolônio, que faremos a seguir. Comecemos com a definição do cone circular
duplo.
Consideremos duas retas distintas e e g concorrentes no ponto V e não perpendiculares. Mantendo o ângulo
entre e e g ŕıgido, iremos fixar a reta e e girar completamente (360◦) a reta g em torno da reta e. A reta g descreve
no espaço uma superf́ıcie que chamamos de cone circular duplo, ou cone circular de duas folhas, ou cone
de revolução duplo, ou cone de revolução de duas folhas.
A reta e é chamada de eixo do cone, enquanto que qualquer uma das retas descritas por g no espaço é chamada
de geratriz do cone. É usual indicar qualquer uma das geratrizes do cone também pela letra g.
Finalmente, o ponto V é chamado de vértice do cone.
V
g
e
360o
q
V
g
e
360o
q
V
g
e
360o
q
Observemos que um cone circular duplo é uma superf́ıcie não limitada, pois a reta g é não limitada.
Vamos à definição das curvas cônicas:
Consideremos um cone circular duplo C com eixo e, geratrizes g e vértice V. Consideremos também um plano
π no espaço tal que:
(1) O plano π não contém o vértice V e é paralelo a uma única geratriz g do cone C.
A intersecção de π com C é uma curva plana que definimos como uma parábola (primeira figura abaixo).
Observemos que, neste caso, o plano π intersecta apenas uma das folhas do cone C.
Observemos também que, com exceção da única geratriz g mencionada na definição acima, todas as demais
geratrizes intersectam o plano π.
A projeção ortogonal da geratriz g acima no plano π é chamada de eixo da parábola.
(2) O plano π não contém o vértice V e é perpendicular ao eixo e do cone C.
A intersecçãode π com C é uma curva plana que definimos como uma circunferência (segunda figura abaixo).
2O ângulo de abertura do cone circular é definido como sendo o ângulo formado pela intersecção do cone simples com um plano que
contém o seu eixo. Tal ângulo também recebe o nome de secção meridiana do cone.
3No caso da hipérbole, com esta construção, o que se obtia era, na verdade, um ramo da hipérbole, e não ela toda, conforme veremos
mais adiante.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 165 de 277 páginas
Observemos que, neste caso, o plano π intersecta todas as geratrizes do cone C em apenas uma de suas folhas.
(3) O plano π não contém o vértice V, não é perpendicular ao eixo e e intersecta todas as geratrizes do cone C.
A intersecção de π com C é uma curva plana que definimos como uma elipse (terceira figura abaixo).
Observemos que, à semelhança da circunferência, na elipse o plano π intersecta todas as geratrizes do cone C
em apenas uma de suas folhas.
(4) O plano π não contém o vértice V e intersecta as duas folhas do cone C.
A intersecção de π com C é uma curva plana que definimos como uma hipérbole (quarta figura abaixo).
Observemos que uma hipérbole é composta por duas “partes” desconexas, chamadas de ramos de hiperbóle.
Observemos também que, neste caso, sempre existirão duas geratrizes g1 e g2 distintas de C paralelas ao plano
π (é fácil convencer-se disso no caso particular em que o eixo e é paralelo ao plano π, conforme ilustrado na figura).
Com exceção das geratrizes g1 e g2, todas as demais geratrizes do cone C intersectam o plano π.
As projeções ortogonais das geratrizes g1 e g2 no plano π são chamadas asśıntotas da hipérbole.
V
ge
p
V
e p
V
e
p
C C C
V
e
p
C
Parábola Circunferência Elipse Hipérbole
Aproveitando a construção proposta por Apolônio, temos ainda mais três possibilidades de intersecção de plano
com cone circular duplo, que são as seguintes:
(a) O plano π contém o vértice V e é o único ponto de intersecção com o cone C.
A intersecção de π com C é um ponto (figura abaixo à esquerda).
(b) O plano π contém o vértice V e uma única geratriz do cone C.
A intersecção de π com C é uma reta (figura abaixo ao centro).
(c) O plano π contém o vértice V e duas geratrizes do cone C.
A intersecção de π com C é um par de retas concorrentes (figura abaixo à direita).
g
e
p
V
e
p
C C
V
e
p
C
RetaPonto Retas Concorrentes
V
Qualquer intersecção do plano π com o cone C é chamada de secção cônica .
As secções cônicas obtidas nos itens de (1) a (4) da definição acima são chamadas de curvas cônicas não
degeneradas ou, simplesmente, curvas cônicas.
As secções cônicas obtidas nos itens (a), (b) e (c) são, às vezes, chamadas de curvas cônicas degeneradas.
Nosso objetivo é estudar mais aprofundadamente as curvas cônicas não degeneradas. Para tanto, não vamos seguir
os passos de Apolônio, pois as definições dadas acima fazem uso de objetos no espaço para tratar de curvas que, na
verdade, são planas, dificultando consideravelmente nosso estudo. Portanto, vamos arranjar um modo de definir as
mesmas curvas cônicas, mas trabalhando exclusivamente em um plano. É o que faremos na próxima seção.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 166 de 277 páginas UFU GAAL
4.2 Curvas Cônicas: definições geométricas
As mesmas curvas cônicas que definimos como secções cônicas acima podem ser definidas de outro modo, que passamos
a descrever abaixo. As demonstrações de que as definições apresentadas são equivalentes serão admitidas, pois está
além dos objetivos dessas notas e constituem exerćıcios dif́ıceis de Geometria Euclidiana Espacial.
4.2.1 Definição Geométrica de Parábola
Fixemos um plano π, um ponto F ∈ π e uma reta d ⊂ π tal que F /∈ d. O lugar geométrico (conjunto) P de
todos os pontos do plano π que equidistam de F e de d é chamado de parábola, ou seja,
P = {P ∈ π : d (P, F) = d (P, d)} .
(não confundir o d que representa reta com o d ( , ) que representa distância)
F
e
parábola
V
P
d
Nomenclatura referente à parábola:
• O ponto F é o foco da parábola P;
• A reta d é a diretriz da parábola P;
• A reta e perpendicular a d passando por F é o eixo da parábola P;
• O ponto {V} = P ∩ e é o vértice da parábola P.
• Um segmento ligando dois pontos quaisquer de P é uma corda da parábola P;
• A corda que passa por F e é perpendicular ao eixo de P é a corda focal mı́nima ou “latus rectum” da parábola P;
• O comprimento da corda focal mı́nima de P é a amplitude focal da parábola P.
Propriedade de Reflexão na Parábola.
Há um conceito interessante associado à parábola que nos cabe comentar mas que, infelizmente, a justificativa
depende de Cálculo Diferencial. É o conceito de reta tangente à parábola em um determinado ponto. Sua definição
formal foge aos objetivos desse texto, pois faz uso de derivadas. Mas, assim como ocorre com a reta tangente a um
ćırculo, é bastante intuitivo pensar na reta tangente à parábola em um determinado ponto como sendo a reta que
a intersecta apenas naquele ponto, e que não “entra” na região onde está o foco.
Agora, consideremos a seguinte situação: imagine que do foco de uma parábola sai um “raio de luz” que incide
na parábola em um ponto T . Neste ponto T consideremos a reta tangente à parábola e imaginemos que o raio de
luz será refletido, como se a reta tangente fosse um espelho. Pelas leis f́ısicas de reflexão, o ângulo de incidência é
igual ao ângulo de reflexão. O fato surpreendente e posśıvel de ser demonstrado é que, no caso da parábola, o raio
de luz refletido é paralelo ao eixo da parábola.
F F
parábola
F
a
b
T
reta tangente
a = b
É claro que se um raio de luz sai do foco, reflete na parábola e fica paralelo ao eixo, então o contrário também
vale, ou seja, um raio de luz paralelo ao eixo da parábola, em sua região “interior”, reflete na parábola e vai para o
foco.
As duas situações descritas acima possuem aplicações práticas muito importantes (em faróis de automóveis e
antenas parabólicas, por exemplo), mas veremos isso quando falarmos de superf́ıcies no próximo caṕıtulo.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 167 de 277 páginas
Construção Geométrica da Parábola.
Há mais de uma maneira de construir uma parábola com “régua e compasso”. A que vamos apresentar aqui, é
bem simples. O leitor é convidado a conferir a construção com o software livre de geometria dinâmica GeoGebra
(referência [7]).
Primeiramente, vamos ao roteiro:
(1) São dados o foco F e a diretriz d , sendo que F /∈ d .
(2) Tomemos um ponto A ∈ d qualquer.
(3) Tracemos a reta r perpendicular a d passando por A.
(4) Consideremos o segmento FA e tracemos sua mediatriz m.
(5) Chamemos o ponto de intersecção da perpendicular r com a mediatriz m de P. (esse ponto sempre existe, pois
F /∈ d )
F
d
P
A
m r
O ponto P está na parábola (que tem foco F e diretriz d ). Para cada A ∈ d temos um ponto P na parábola. No
software GeoGebra é posśıvel ver a construção dinâmica da parábola fazendo o ponto A deslizar sobre a diretriz,
enquanto que o ponto P desliza sobre a parábola. Além disso, é posśıvel provar que a mediatriz m é reta tangente
à parábola no ponto P. Abaixo segue uma figura desta construção no GeoGebra.
Observação. No GeoGebra há uma ferramenta chamada “lugar geométrico” (procure nos menus). Ela permite
que se visualize a parábola toda, como na figura acima. Depois de selecionada a ferramenta “lugar geométrico”,
clique no ponto P e, depois, no ponto A. O software mostra o conjunto (lugar geométrico) de todos os pontos P
posśıveis à medida que A percorre a diretriz.Todos os pontos P posśıveis formam, exatamente, a parábola. Depois
disso, é interessante ver a movimentação do ponto P na parábola. Isso pode ser feito de duas formas: (1) com o
mouse, podemos arrastar o ponto A (que está “preso” na diretriz d ) e (2) com o comando “animar” aplicado ao
ponto A (clique como botão direito do mouse sobre o ponto A para ver essa opção).
Por que esta contrução geométrica funciona?
Por que o triângulo PAF é isósceles! A mediatriz m tem a propriedade de que seus pontos são equidistantes de
A e F. É fácil provar essa propriedade dividindo o triângulo PAF em dois triângulos retângulos e usando o caso de
congruência de triângulos LAL (lado, ângulo, lado). Isto significa que PA = PF e, portanto, a definição de parábola
está satisfeita em nossa construção.
Finalizamos esta subseção com mais uma curiosidade sobre parábolas (que, também, não demonstraremos, por
falta de pré-requisitos). Assim como o ćırculo, a parábola é única a menos de fator de escala. O que significa isso? Na
linguagem da informática: todas as parábolas são iguais a menos de “zoom”. Embora possa soar estranho, esse é um
comportamento análogo ao do ćırculo, quando dizemos que todos eles são iguais a menos do raio. Quando introduzirmos
o conceito de excentricidade para ćırculos e parábolas, veremos que essas afirmações são procedentes, pois qualquer
ćırculo possui a mesma excentricidade, o mesmo ocorrendo com qualquer parábola. Conforme já tivemos oportunidade
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 168 de 277 páginas UFU GAAL
de ver nos casos das elipses e das hipérboles, a excentricidade de uma curva está relacionada com o “formato” dessa
curva.
4.2.2 Definição Geométrica de Elipse
Fixemos um plano π e dois pontos distintos F1, F2 ∈ π. Chamemos d (F1, F2) = 2c > 0 e consideremos um
número real a tal que a > c. O lugar geométrico (conjunto) E de todos os pontos do plano π cuja soma das
distâncias até F1 e F2 é igual a 2a é chamado de elipse, ou seja,
E = {P ∈ π : d (P, F1) + d (P, F2) = 2a} .
elipse
F1 F2
A1 A2
B1
B2P
2c
2a
2b
b
a
cC
Nomenclatura referente a elipse:
• Os pontos F1 e F2 são os focos da elipse E ;
• O número 2c é a distância focal da elipse E ;
• O ponto médio C de F1F2 é o centro da elipse E ;
• O segmento A1A2 de comprimento 2a, com extremos na elipse, e que contém F1F2 é o eixo maior da elipse E ;
• O segmento B1B2, cujo comprimento denotamos por 2b, com extremos na elipse, e perpendicular a F1F2 em C é o
eixo menor da elipse E ;
• Os pontos A1, A2, B1 e B2 são os vértices da elipse E ;
• O número e = c
a
é a excentricidade da elipse E .
• Um segmento ligando dois pontos quaisquer de E é uma corda da elipse E ;
• A corda que passa por um foco e é perpendicular ao eixo maior de E é uma corda focal mı́nima ou “latus rectum”
da elipse E ;
• O comprimento de uma corda focal mı́nima de E é a amplitude focal da elipse E .
Observemos que em uma elipse:
a2 = b2 + c2 ,
o que justifica o “2” nas considerações acima e, consequentemente,
0 < e < 1 .
Observemos que quanto mais próxima de 0 for a excentricidade de uma elipse, mais parecida com uma circunferência
ela será.
Propriedade de Reflexão na Elipse.
Assim como nas parábolas, as elipses possuem propriedades de reflexão (que para serem justificadas dependem
de Cálculo Diferencial). Assim como ocorre com a reta tangente a um ćırculo, é bastante intuitivo pensar na reta
tangente à elipse em um determinado ponto como sendo a reta que a intersecta apenas naquele ponto.
Agora, consideremos a seguinte situação: imagine que de um dos focos de uma elipse sai um “raio de luz” que
incide internamente na elipse em um ponto T . Neste ponto T consideremos a reta tangente à elipse e imaginemos
que o raio de luz será refletido, como se a reta tangente fosse um espelho. Pelas leis f́ısicas de reflexão, o ângulo de
incidência é igual ao ângulo de reflexão, e o raio de luz refletido incide sobre o outro foco da elipse.
elipse
a b
T
reta tangente
a = b
F1 F2 F1 F2
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 169 de 277 páginas
Veremos aplicações práticas dessa propriedade de reflexão das elipses (em lanterna de cadeira de dentista, por
exemplo) quando falarmos de superf́ıcies no próximo caṕıtulo.
Construção Geométrica da Elipse.
Assim como nas parábolas, há mais de uma maneira de construir uma elipse com “régua e compasso”. A que
vamos apresentar aqui é similar àquela feita na seção das parábolas, usando mediatriz, e é bem simples. O leitor é
convidado a conferir a construção com o software livre de geometria dinâmica GeoGebra (referência [7]).
Primeiramente, vamos ao roteiro:
(1) São dados os focos F1 e F2 (portanto, temos c =
d(F1,F2)
2
> 0) e consideremos fixado um número a tal que
a > c.
(2) Tracemos o ćırculo C de raio 2a e centro em F1 (logo, F2 está no interior do ćırculo).
(3) Tomemos um ponto A ∈ C qualquer.
(4) Tracemos os segmentos AF1 e AF2.
(5) Tracemos a mediatriz m de AF2.
(6) Chamemos o ponto de intersecção da mediatriz m como o segmento AF1 de P.
O ponto P sempre existe, pois no triângulo AF1F2 a mediatriz m de AF2 sempre intersecta o maior dos outros
dois lados do triângulo. Como AF1 = 2a > 2c = F1F2 temos que m intersecta AF1.
P
A
m
F1 F2
2c
2aC
O ponto P está na elipse (de focos F1 e F2). Para cada A ∈ C temos um ponto P na elipse. No software GeoGebra
é posśıvel ver a construção dinâmica da elipse fazendo o ponto A deslizar sobre o ćırculo C, enquanto que o ponto P
desliza sobre a elipse. Além disso, é posśıvel provar que a mediatriz m é reta tangente à elipse no ponto P. Abaixo
segue uma figura desta construção no GeoGebra.
Observação. No GeoGebra há uma ferramenta chamada “lugar geométrico” (procure nos menus). Ela permite
que se visualize a elipse toda, como na figura acima. Depois de selecionada a ferramenta “lugar geométrico”, clique
no ponto P e, depois, no ponto A. O software mostra o conjunto (lugar geométrico) de todos os pontos P posśıveis
à medida que A percorre o ćırculo. Todos os pontos P posśıveis formam, exatamente, a elipse. Depois disso, é
interessante ver a movimentação do ponto P na elipse. Isso pode ser feito de duas formas: (1) com o mouse,
podemos arrastar o ponto A (que está “preso” no ćırculo) e (2) com o comando “animar” aplicado ao ponto A
(clique como botão direito do mouse sobre o ponto A para ver essa opção).
Por que esta contrução geométrica funciona?
Por que o triângulo PAF2 é isósceles! A mediatriz m tem a propriedade de que seus pontos são equidistantes de
A e F2. É fácil provar essa propriedade dividindo o triângulo PAF2 em dois triângulos retângulos e usando o caso
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 170 de 277 páginas UFU GAAL
de congruência de triângulos LAL (lado, ângulo, lado). Isto significa que PA = PF2. Mas PF1 + PA = 2a (raio do
ćırculo C). Logo, PF1 + PF2 = 2a e, portanto, a definição de elipse está satisfeita em nossa construção.
As elipses também estão presentes nas órbitas dos planetas do Sistema Solar em torno do sol. É a chamada
Primeira Lei de Kepler que enuncia isso. O sol sempre está em um dos focos da trajetória eĺıptica de cada planeta.
Há dois ótimos v́ıdeos do canal educacional Socratica na Internet explicando a Primeira Lei de Kepler, ou Lei
das Órbitas (https://youtu.be/g1b8zZ3LZhY), e a Segunda Lei de Kepler, ou Lei das Áreas, (https://youtu.be/
iQNpJMBObnQ). No primeiro v́ıdeo há uma parte interessante onde uma elipse é desenhada sobre uma folha de
papel com o aux́ılio de dois pregos, que fazem o papel dos focos, e um pedaço de barbante, de comprimento 2a. Vale
a pena conferir! A curva cônica elipse éa base dessas importantes leis da F́ısica e, se o leitor gostar desses v́ıdeos,
sugerimos que vá adiante e pesquise na Internet sobre a Terceira Lei de Kepler, ou Lei dos Peŕıodos.
Finalizamos esta subseção com uma curiosidade sobre a excentridade das órbitas eĺıpticas dos planetas do Sistema
Solar, além da órbita do Cometa Halley, que também possui o sol em um dos focos. O pobre Plutão, que foi rebaixado
enquanto planeta, também está na lista.
Planeta Excentricidade Classificação
Mercúrio 0, 2056 8o.
Vênus 0, 0068 1o. (quase um ćırculo!)
Terra 0, 0167 3o.
Marte 0, 093 7o.
Júpiter 0, 048 5o.
Saturno 0, 056 6o.
Urano 0, 046 4o.
Netuno 0, 0097 2o.
Plutão 0, 2488 9o.
Cometa Halley 0, 967 10o. (extremamente “achatada”)
4.2.3 Definição Geométrica de Circunferência
A definição de circunferência é conhecida desde o Ensino Fundamental. Mas, por ser uma curva cônica, vamos
repetir sua definição geométrica aqui.
Fixemos um plano π, um ponto C ∈ π e um número r > 0. O lugar geométrico (conjunto) C de todos os pontos
do plano π à distância r de C é chamado de circunferência, ou seja,
C = {P ∈ π : d (P,C) = r} .
circunferênciaC
P
r
É importante enfatizarmos uma observação sobre as palavras ćırculo e circunferência. A palavra circunferência é
aplicada (geralmente) apenas no contexto da curva que satisfaz a definição que demos acima. Já a palavra ćırculo pode
ser sinônimo de circunferência ou sinônimo de disco. Um disco é uma região plana constituida por uma circunferência
(que o delimita) e os pontos interiores a esta circunferência. Quando falamos em comprimento de ćırculo, estamos
pensando no ćırculo como curva, ou seja, como circunferência. Quando falamos em área de um ćırculo, estamos
pensando no ćırculo como região plana, ou seja, como disco. Além disso, o contexto dos problemas ou aplicações
sempre deixa claro ao que estas palavras se referem. Se pensarmos bem, em Matemática há várias outras palavras que
são utilizadas em mais de um contexto. A palavra poĺıgono, por exemplo, pode designar um conjunto de segmentos e
falamos em peŕımetro do poĺıgono, ou uma região plana, e falamos em área do poĺıgono.
Nomenclatura referente a circunferência:
• O ponto C é o centro da circunferência C;
• O número r é o raio da circunferência C.
Observemos, também, que se na definição de elipse permit́ıssemos que F1 = F2 = C, teŕıamos c = 0 e a = r. Com
isso, podemos enxergar a circunferência como uma espécie de “elipse degenerada” cuja excentricidade seria nula.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
https://youtu.be/g1b8zZ3LZhY
https://youtu.be/iQNpJMBObnQ
https://youtu.be/iQNpJMBObnQ
sites.google.com/site/edsonagustini
GAAL UFU Página 171 de 277 páginas
4.2.4 Definição Geométrica de Hipérbole
Fixemos um plano π e dois pontos distintos F1, F2 ∈ π. Chamemos d (F1, F2) = 2c > 0 e consideremos um
número real positivo a tal que a < c. O lugar geométrico (conjunto) H de todos os pontos do plano π cujo módulo
da diferença das distâncias até F1 e F2 é igual a 2a é chamado de hipérbole, ou seja,
H = {P ∈ π : |d (P, F1) − d (P, F2) | = 2a} .
Observação: o módulo que surgiu na definição acima faz com que a hipérbole seja composta por duas “partes”
desconexas, que são os ramos da hipérbole.
hipérbole F1 F2A1 A2
B1
B2
P
2c
2a
2b
c
b
a
C
r s
Nomenclatura referente a hipérbole:
• Os pontos F1 e F2 são os focos da hipérbole H;
• O número 2c é a distância focal da hipérbole H;
• O ponto médio C de F1F2 é o centro da hipérbole H;
• O segmento A1A2 de comprimento 2a, com extremos na hipérbole, e que está contido em F1F2 é o eixo real , ou
eixo transverso, da hipérbole H;
• O segmento B1B2, cujo comprimento denotamos por 2b, perpendicular a F1F2, sendo C ponto médio de B1B2, e tal
que c2 = b2 + a2 é o eixo imaginário, ou eixo eixo não transverso, da hipérbole H;
• Os pontos A1 e A2 são os vértices da hipérbole H;
• O número e = c
a
é a excentricidade da hipérbole H;
• As retas r e s que passam por C e formam ângulo de medida θ tal que tg (θ) = b
a
com a reta que passa pelo eixo
real da hipérbole são as duas retas asśıntotas da hipérbole H.
• Uma hipérbole com retas asśıntotas perpendiculares é chamada de hipérbole equilátera (neste caso, θ = 45◦).
• Um segmento ligando dois pontos quaisquer de um mesmo ramo da hipérbole H é uma corda da hipérbole H;
• A corda que passa por um foco e é perpendicular à reta que passa pelo eixo real de H é uma corda focal mı́nima
ou “latus rectum” da hipérbole H;
• O comprimento de uma corda focal mı́nima de H é a amplitude focal da hipérbole H.
É posśıvel mostrar rigorosamente que os pontos dos ramos da hipérbole “aproximam-se sem tocar” das retas
asśıntotas à medida em que estão mais distantes do centro da hipérbole.
Observemos que em uma hipérbole, conforme definido acima,
c2 = b2 + a2 ,
o que justifica o “2” nas considerações acima e, consequentemente,
e > 1 .
Observemos também que, quanto mais próxima de 1 for a excentricidade de uma hipérbole, menor será o ângulo
que as asśıntotas formam com a reta que passa pelo eixo real da hipérbole e, portanto, mais “achatada” ou “fechada”
ela será.
Propriedade de Reflexão na Hipérbole.
Assim como nas parábolas e elipses, as hipérboles possuem propriedades de reflexão (que, mais uma vez, para
serem justificadas dependem de Cálculo Diferencial). Podemos pensar na reta tangente à hipérbole em um deter-
minado ponto como sendo a reta que a intersecta apenas naquele ponto, e que está inteiramente contida na região
entre os dois ramos da hipérbole.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 172 de 277 páginas UFU GAAL
Agora, consideremos a seguinte situação: tomemos uma hipérbole com ramos r1 e r2, sendo que r1 está “contor-
nando” o foco F1 e r2 o foco F2 ( na figura acima, r1 é o ramo da esquerda e r2 é o ramo da direita). Imagine que
um “raio de luz” percorrendo o plano em direção ao foco F2, atravessando a região entre os dois ramos da hipérbole.
Chamemos de T o ponto de incidência do raio de luz no ramo r2 da hipérbole e consideremos a reta tangente à
hipérbole neste ponto. Imaginemos que o raio de luz será refletido, como se a reta tangente fosse um espelho. Pelas
leis f́ısicas de reflexão, o ângulo de incidência é igual ao ângulo de reflexão, e o raio de luz refletido incide sobre o
outro foco da hipérbole.
hipérbole
T
b
F1 F2
a
reta tangente
r1 r2
F1 F2
a = b
Veremos aplicações práticas dessa propriedade de reflexão das hipérboles (em telescópios, por exemplo) quando
falarmos de superf́ıcies no próximo caṕıtulo.
Construção Geométrica da Hipérbole.
Assim como nas parábolas e elipses, há mais de uma maneira de construir uma hipérbole com “régua e compasso”.
A que vamos apresentar aqui é muito semelhante àquela feita na seção das elipses, usando mediatriz, e é bem simples.
O leitor é convidado a conferir a construção com o software livre de geometria dinâmica GeoGebra (referência [7]).
Primeiramente, vamos ao roteiro:
(1) São dados os focos F1 e F2 (portanto, temos c =
d(F1,F2)
2
> 0) e consideremos fixado um número a tal que
a < c.
(2) Tracemos o ćırculo C de raio 2a e centro em F1 (logo, F2 está no exterior do ćırculo).
(3) Tomemos um ponto A ∈ C qualquer.
(4) Tracemos a reta AF1.
(5) Tracemos o segmento AF2.
(6) Tracemos a mediatriz m de AF2.
(7) Chamemos o ponto de intersecção da mediatriz m como a reta AF1 de P.
O ponto P somente existe quando m não é paralela à reta AF1. Há duas posições posśıveis de A em C onde este
paralelismo ocorre. Nestas duas posições a mediatriz m assume a posição de asśıntota da hipérbole.
hipérbole
F1 F2
P
2c
2a
A
m
C
O ponto P está na hipérbole (de focos F1 e F2). Para cada A ∈ C temos um ponto P na hipérbole. No softwareGeoGebra é posśıvel ver a construção dinâmica da hipérbole fazendo o ponto A deslizar sobre o ćırculo C, enquanto
que o ponto P desliza sobre a hipérbole. Além disso, é posśıvel provar que a mediatriz m é reta tangente à hipérbole
no ponto P. Abaixo segue uma figura desta construção no GeoGebra.
Observação. No GeoGebra há uma ferramenta chamada “lugar geométrico” (procure nos menus). Ela permite
que se visualize a hipérbole toda, como na figura acima. Depois de selecionada a ferramenta “lugar geométrico”,
clique no ponto P e, depois, no ponto A. O software mostra o conjunto (lugar geométrico) de todos os pontos P
posśıveis à medida que A percorre o ćırculo. Todos os pontos P posśıveis formam, exatamente, a hipérbole. Depois
disso, é interessante ver a movimentação do ponto P na hipérbole. Isso pode ser feito de duas formas: (1) com o
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 173 de 277 páginas
mouse, podemos arrastar o ponto A (que está “preso” no ćırculo) e (2) com o comando “animar” aplicado ao ponto
A (clique como botão direito do mouse sobre o ponto A para ver essa opção).
Por que esta contrução geométrica funciona?
Por que o triângulo PAF2 é isósceles! A mediatriz m tem a propriedade de que seus pontos são equidistantes de
A e F2. É fácil provar essa propriedade dividindo o triângulo PAF2 em dois triângulos retângulos e usando o caso de
congruência de triângulos LAL (lado, ângulo, lado). Isto significa que PA = PF2. Temos duas situações posśıveis:
• A entre P e F1. Neste caso, PF1 = PA+AF1 = PF2 + 2a⇒ PF1 − PF2 = 2a.
• F1 entre P e A. Neste caso, PA = PF1 +AF1 ⇒ PF2 = PF1 + 2a⇒ PF2 − PF1 = 2a.
Em qualquer situação temos |PF1 − PF2| = 2a. Portanto, a definição de hipérbole está satisfeita em nossa
construção.
Observação: cada uma das situações acima corresponde a P em um dos ramos da hipérbole.
4.3 Curvas Cônicas: equações cartesianas
A partir desta seção vamos começar a usar coordenadas para estudar as curvas, associando-as a equações, ou
seja, vamos começar a fazer Geometria Anaĺıtica. Para tanto, vamos fixar um Sistema de Coordenadas Cartesianas
Ortogonais Oxy no plano com base canônica B = {~i,~j}. Como a base canônica não aparecerá de forma expĺıcita
no desenvolvimento a seguir, para efeitos de simplificação, não mais a mencionaremos quando fixarmos o sistema de
coordenadas.
Nosso interesse nesta seção é deduzir equações cartesianas para algumas curvas cônicas posicionadas em lugares
estratégicos no plano cartesiano.
4.3.1 Equação Cartesiana Geral de uma Curva Cônica
Um conjunto constitúıdo por todos os pontos P (x, y) ∈ R2 cujas coordenadas satisfazem uma equação quadrática
da forma
Ax2 + Bxy+ Cy2 +Dx+ Ey+ F = 0 ,
sendo A,B,C,D, E, F ∈ R fixos, com A, B ou C diferentes de 0, é, genericamente, chamado de curva cônica.
É posśıvel mostrar que qualquer uma das curvas cônicas estudadas ou citadas anteriormente (inclusive as de-
generadas) possui equação cartesiana na forma acima. Por esse motivo, a equação acima é chamada de equação
geral de uma curva cônica.
Exemplo 4.1 (1) A equação x2 + y2 = 0 é a equação cartesiana da curva cônica degenerada constitúıda apenas pelo
ponto P (0, 0), pois x = 0 e y = 0 são as únicas soluções da equação.
(2) A equação x2 = 0 (ou seja, x = 0) é a equação cartesiana da curva cônica degenerada constitúıda pelo eixo Oy,
pois qualquer ponto P (x, y) do eixo Oy possui x = 0.
(3) A equação xy = 0 (ou seja, x = 0 ou y = 0) é a equação cartesiana da curva cônica degenerada constitúıda pelo
par de eixos concorrentes Ox e Oy, pois qualquer ponto P (x, y) desses eixos possuem x = 0 ou y = 0.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 174 de 277 páginas UFU GAAL
(4) A equação y2 + y = 0 (ou seja, y (y+ 1) = 0 ⇒ y = 0 ou y = −1) é a equação cartesiana da curva cônica
degenerada constitúıda por um par de retas paralelas, pois qualquer ponto P (x, y) com y = 0 ou y = −1 estão em
retas paralelas ao eixo Ox.
(5) A equação x2 + 1 = 0 é a equação cartesiana da curva cônica degenerada constitúıda pelo conjunto vazio, pois
x =
√
−1 não é numero real.
Nota: É posśıvel demonstrar que, além das curvas cônicas degeneradas do exemplo acima, a equação geral Ax2 +
Bxy + Cy2 + Dx + Ey + F = 0 pode representar parábola, elipse, circunferência e hipérbole. Essas 9 curvas cônicas
(entre degeneradas e não degeneradas) fecham a classificação das curvas que esta equação pode representar.
4.3.2 Equação Cartesiana de Parábola
Exemplo 4.2 Mostremos que se uma parábola possui diretriz paralela, ou coincidente, ao eixo Ox (portanto, conca-
vidade para cima ou para baixo), então sua equação cartesiana é da forma
y = ax2 + bx+ c ,
com a, b, c ∈ R e a 6= 0.
De fato, suponhamos que o foco da parábola seja o ponto F (m,n). Sua diretriz d possui equação cartesiana da
forma y = k. Logo, n 6= k. Seja P (x, y) um ponto da parábola e Pd (x, k) o pé da perpendicular baixada de P à
diretriz d .
Parábolas
y ax bx c= + +2
x
y
F m n( , )
k
d
P x y( , )
P x kd( , )
x
y
F m n( , )
k
d
P x y( , )
P x kd( , )
a 0> a 0<
Pela definição de parábola, temos
d (P, F) = d (P, d )⇒ d (P, F) = d (P, Pd )⇒ d ((x, y) , (m,n)) = d ((x, y) , (x, k))⇒»
(x−m)
2
+ (y− n)
2
=
»
(x− x)
2
+ (y− k)
2 ⇒ (x−m)2 + (y− n)2 = (y− k)2 ⇒
x2 − 2xm+m2 + y2 − 2yn+ n2 = y2 − 2yk+ k2 ⇒ x2 − 2mx+m2 + n2 − k2 = (2n− 2k)y⇒
y = 1
2n−2kx
2 + m
k−nx+
m2+n2−k2
2n−2k , pois n 6= k.
Fazendo a = 1
2n−2k , b =
m
k−n e c =
m2+n2−k2
2n−2k chegamos à equação
y = ax2 + bx+ c ,
conforme queŕıamos.
Observemos que a equação do Exemplo 4.2 acima se enquadra na equação geral de curva cônica, sendo que y =
ax2+bx+c corresponde a A = a, B = C = 0, D = b, E = −1 e F = c na equação geral Ax2+Bxy+Cy2+Dx+Ey+F = 0.
Observemos, também, que a equação da forma y = ax2+bx+c é muito utilizada nos cursos de Cálculo Diferencial
e Integral, pois, quando temos uma função y = f (x) polinomial de grau dois, ela é, geralmente, apresentada com a
expressão f (x) = ax2+bx+c. Além disso, quando é preciso encontrar as ráızes de y = f (x), cáımos na forma clássica
da equação do segundo grau: ax2 + bx+ c = 0, cuja fórmula de resolução é bem conhecida e é dada por x = −b±
√
∆
2a
,
sendo ∆ = b2 − 4ac o discriminante da equação do segundo grau.
Aproveitando que estamos falando de discriminante de equações do segundo grau, recordemos, da teoria de funções
estudada no Ensino Médio, que o gráfico de uma função polinomial de grau dois (função quadrática) é uma parábola,
com concavidade para cima ou para baixo, a depender do coeficiente a do x2, cujo vértice possui coordenadas
V
(
− b
2a
,− ∆
4a
)
. Essa é uma informação bastante útil e está vinculada à equação cartesiana y = ax2 + bx + c que
apresentamos acima. Segue o enunciado formal desse resultado matemático, cuja demonstração pode ser encontrada
na referência [12].
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 175 de 277 páginas
Proposição 4.1 (Coordenadas de vértice de parábola) Seja Oxy sistema de coordenadas cartesianas ortogonais no
plano. A parábola de equação cartesiana y = ax2 + bx+ c, sendo a 6= 0, possui vértice com coordenadas
V
(
− b
2a
,− ∆
4a
)
,
sendo ∆ = b2 − 4ac o discriminante da equação do segundo grau ax2 + bx+ c = 0.
A figura abaixo ilustra todas as possibilidades, referentes a a e ∆, na proposição acima.
-D/4a
c
x1 x
y
x2
- /b 2a
V
-D/4a
c
x1
x
y
x2
- /b 2a
V
0
c
x
y
- /b 2a
V
0
c
x
y
- /b 2a
V
-D/4a
c
x
y
- /b 2a
V
-D/4a
c
x
y
- /b 2a
V
a > 0
> 0D
a > 0
0D =
a > 0
< 0D
a < 0
> 0D
a < 0
0D =
a < 0
< 0D
O próximo exemploé análogo ao Exemplo 4.2 acima e será deixado como exerćıcio para o leitor.
Exemplo 4.3 Mostre que se uma parábola possui diretriz paralela, ou coincidente, ao eixo Oy (portanto, concavidade
para a direita ou para a esquerda), então sua equação cartesiana é da forma
x = ay2 + by+ c
com a, b, c ∈ R e a 6= 0.
Há uma outra forma de apresentação da equação cartesiana de uma parábola com diretriz horizontal que pode ser
útil em diversas situações. Trata-se do próximo exemplo.
Exemplo 4.4 Sejam p 6= 0, x0 e y0 reais. Mostremos que se uma parábola possui diretriz d horizontal com equação
cartesiana y = y0 − p e foco F (x0, y0 + p) (portanto, vértice V (x0, y0)), então sua equação cartesiana é da forma
(x− x0)
2
= 4p (y− y0) ,
chamada de equação reduzida da parábola , sendo que se p > 0, a concavidade é para cima e se p < 0, a concavidade
é para baixo.
De fato, seja P (x, y) um ponto da parábola e Pd (x, y0 − p) o pé da perpendicular baixada de P à diretriz d .
Parábolas
( - ) = ( - )x x 4p y y0 0
2
x
y
F p( + )x y0 0,
d
P x y( , )
P x y pd( , - )0
x
y
d
P x y( , )
p 0> p 0<
y p0 -
V( )x y0 0,
y p0 -
F p( + )x y0 0,
P x y pd( , - )0V( )x y0 0,
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 176 de 277 páginas UFU GAAL
Pela definição de parábola, temos
d (P, F) = d (P, d )⇒ d (P, F) = d (P, Pd )⇒ d ((x, y) , (x0, y0 + p)) = d ((x, y) , (x, y0 − p))⇒»
(x− x0)
2
+ (y− (y0 + p))
2
=
»
(x− x)
2
+ (y− (y0 − p))
2 ⇒ (x− x0)2 + (y− (y0 + p))2 = (y− (y0 − p))2 ⇒
(x− x0)
2
+ y2 − 2y (y0 + p) + (y0 + p)
2
= y2 − 2y (y0 − p) + (y0 − p)
2 ⇒
(x− x0)
2
+ y2 − 2yy0 − 2yp+ y
2
0 + 2y0p+ p
2 = y2 − 2yy0 + 2yp+ y
2
0 − 2y0p+ p
2 ⇒
(x− x0)
2
− 2yp+ 2y0p = 2yp− 2y0p⇒ (x− x0)2 = 4p (y− y0) .
Observemos que se p > 0, então o foco está acima da diretriz e, portanto, a concavidade da parábola é para cima.
Se p < 0, então o foco está abaixo da diretriz e, portanto, a concavidade da parábola é para baixo.
Particularmente, se no Exemplo 4.4 acima o vértice estiver na origem, ou seja, V (x0, y0) = (0, 0) e, portanto, a
diretriz possuir equação y = −p e o foco for F (0, p), então a equação cartesiana reduzida da parábola assume uma
forma extremamente simples:
x2 = 4py .
Observação importante: O número p 6= 0 no Exemplo 4.4 acima é chamado de parâmetro da parábola e a
distância do foco à diretriz é 2|p|. Alguns autores como, por exemplo, na referência [20], consideram essa distância
como sendo o próprio módulo do parâmetro, ou seja, |p|; considerando a equação da diretriz como sendo y = y0−
p
2
e o foco como sendo F
(
x0, y0 +
p
2
)
. Nesse caso, a equação cartesiana da parábola é dada por
(x− x0)
2
= 2p (y− y0)
e, no caso particular em que o vértice está na origem, é dada por
x2 = 2py.
Notemos, mais uma vez, que, se p > 0, então a concavidade da parábola é “para cima”, enquanto que, se p < 0,
então a concavidade da parábola é “para baixo”.
O desenvolvimento que fizemos no Exemplo 4.4, com a distância do foco à diretriz como sendo 2|p|, foi baseado
na referência [4].
Portanto, quando trabalhar com equações de parábolas que utilizam o parâmetro p, fique atento a qual das
duas situações ele se refere.
O próximo exemplo é análogo ao Exemplo 4.4 acima e será deixado como exerćıcio para o leitor.
Exemplo 4.5 Sejam p 6= 0, x0 e y0 reais. Mostre que se uma parábola possui diretriz d vertical com equação
cartesiana x = x0 − p e foco F (x0 + p, y0) (portanto, vértice V (x0, y0)), então sua equação cartesiana é da forma
(y− y0)
2
= 4p (x− x0) ,
também chamada de equação reduzida da parábola , sendo que se p > 0, a concavidade é para a direita e se p < 0,
a concavidade é para a esquerda.
Mais uma vez, caso particular similar ao Exemplo 4.4 também ocorre no Exemplo 4.5 quando o vértice estiver na
origem, ou seja, V (x0, y0) = (0, 0) e, portanto, a diretriz possuir equação x = −p e o foco for F (p, 0), então a equação
cartesiana reduzida da parábola é muito simples e assume a forma
y2 = 4px .
A “observação importante” feita acima também se aplica ao Exemplo 4.5.
Exemplo 4.6 (Corda focal mı́nima) Consideremos a parábola com vértice na origem e equação reduzida y2 = 4px;
(p 6= 0). Vimos que a corda CC′, que passa pelo foco F e é perpendicular ao seu eixo, chama-se corda focal mı́nima ou
latus rectum da parábola. Seu comprimento, chamado de amplitude focal, é 4|p|.
De fato, fazendo x = p na equação y2 = 4px temos duas posśıveis soluções: y = ±2
√
p2 = ±2|p|. Portanto, os
extremos da corda focal mı́nima podem ser C (p, 2|p|) e C′ (p,−2|p|). Logo, d (C,C′) =
»
(p− p)
2
+ (2|p|+ 2|p|)
2
=
4|p|, ou seja,
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 177 de 277 páginas
CC′ = 4|p|
x
y
C p p( ,2 )
C p p¢( ,-2 )
F p 0( , )
x
y
C p 2p( ,- )
C p 2p¢( , )
F p 0( , )
p 0> p 0<
Parábolas
y 4px2 =
O mesmo resultado é válido para parábolas com equações x2 = 4py ou, mais geralmente, (y− y0)
2
= 4p (x− x0)
ou (x− x0)
2
= 4p (y− y0).
Curiosidade. Por que a corda focal mı́nima é “mı́nima”?
Como se prova que dentre todas as cordas da parábola que passam pelo foco, a corda focal mı́nima é a que
possui o menor comprimento? (dáı o adjetivo “mı́nima”)
Para demonstrar isso, precisamos de Cálculo Diferencial, mais precisamente, de derivadas. Vamos apresentar
a montagem do problema a t́ıtulo de curiosidade, sendo que para o embasamento teórico sugerimos um livro de
Cálculo qualquer.
Para facilitar as contas, tomemos uma parábola de equação reduzida x2 = 4py, portanto, com vértice na origem
e concavidade para cima, sendo o foco F (0, p) com p > 0.
As retas que passam pelo foco F possuem equação y− p = m (x− 0), sendo m coeficiente angular.
Há uma reta que passa pelo foco que não é contemplada pela equação acima, que é a reta vertical de equação
x = 0 (é o eixo da parábola). Mas esta reta não nos interessa, pois ela não determina corda na parábola.
x
y
C
F 0 p( , )
p 0>Parábola
x 4py2 =
C¢
y p mx- =
Fazendo a intersecção de uma reta y−p = mx com a parábola x2 = 4py encontramos dois pontos de intersecção
que determinarão os extremos de uma corda focal. Para isto, basta resolver o sistema (não linear):{
y− p = mx
x2 = 4py
.
Fazendo as contas (faça...), encontramos
x = 2mp± 2p
√
m2 + 1.
Substituindo na segunda linha x2 = 4py temos
y = p
Ä
m±
√
m2 + 1
ä2
.
Logo, podemos considerar os extremos da corda focal CC′ como sendo
C
Å
2p
Ä
m−
√
m2 + 1
ä
, p
Ä
m−
√
m2 + 1
ä2ã
e C′
Å
2p
Ä
m+
√
m2 + 1
ä
, p
Ä
m+
√
m2 + 1
ä2ã
.
Chamemos a distância ao quadrado de C a C′ de f. Logo, f está em função do coeficiente angular m:
f (m) = d2 (C,C′) =
Ä
2p
Ä
m−
√
m2 + 1
ä
− 2p
Ä
m+
√
m2 + 1
ää2
+
Å
p
Ä
m−
√
m2 + 1
ä2
− p
Ä
m+
√
m2 + 1
ä2ã2
= · · · = 16p2m4 + 32p2m2 + 16p2.
A derivada e f é dada por
f′ (m) = 64p2m3 + 64p2m.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 178 de 277 páginas UFU GAAL
Os valores de m, candidatos a maximizarem ou minimizarem f (chamados de pontos cŕıticos de f) são as ráızes
de f′ (m) = 0. Neste caso, temos uma raiz real, que é m = 0 e duas ráızes complexas m = ±
√
−1 (que não servem,
pois o coeficiente angular m é um número real).
De acordo com o Cálculo Diferencial, m = 0 é o único candidato a maximizar ou minimizar f e, mais do que
isso, por meio do chamado “teste da derivada segunda”, conclui-se que m = 0 minimiza f.
Por fim, um resultado também do Cálculo Diferencial (que não vamos provar aqui):
m minimiza f = d2 ⇐⇒ m minimiza d,
ou seja, m = 0 minimiza o comprimento da corda focal CC′.
Mas m = 0 significa que que a reta y − p = mx é horizontal e possui equação y = p. Portanto C (−2p, p) e
C′ (2p, p).
Estamos, portanto, diante da cordafocal mı́nima, conforme a definimos.
4.3.3 Equação Cartesiana de Elipse
Exemplo 4.7 Mostremos que se uma elipse possui centro no ponto C (x0, y0), focos no eixo Ox ou em reta paralela
a Ox, eixo maior medindo 2a e eixo menor medindo 2b, então sua equação cartesiana é da forma
(x−x0)
2
a2
+ (y−y0)
2
b2
= 1 ,
elipse
C
x
y
2b
2a
y0
x0
F1 F2
x0-c x0+c
P
chamada de equação reduzida da elipse .
De fato, façamos F1 (x0 − c, y0), F2 (x0 + c, y0) como focos da elipse. Temos a
2 = b2 + c2.
Seja P (x, y) um ponto qualquer da elipse. Pela sua definição geométrica:
d (P, F1) + d (P, F2) = 2a ⇒ d (P, F1) = 2a− d (P, F2)⇒»
(x− (x0 − c))
2
+ (y− y0)
2
= 2a−
»
(x− (x0 + c))
2
+ (y− y0)
2 ⇒Å»
(x− x0 + c)
2
+ (y− y0)
2
ã2
=
Å
2a−
»
(x− x0 − c)
2
+ (y− y0)
2
ã2 ⇒
(x− x0 + c)
2
+ (y− y0)
2
= 4a2 − 4a
»
(x− x0 − c)
2
+ (y− y0)
2
+ (x− x0 − c)
2
+ (y− y0)
2 ⇒
(x− x0)
2
+ 2c (x− x0) + c
2 = 4a2 − 4a
»
(x− x0 − c)
2
+ (y− y0)
2
+ (x− x0)
2
− 2c (x− x0) + c
2 ⇒
2c (x− x0) = 4a
2 − 4a
»
(x− x0 − c)
2
+ (y− y0)
2
− 2c (x− x0)⇒
c (x− x0) − a
2 = −a
»
(x− x0 − c)
2
+ (y− y0)
2 ⇒(
c (x− x0) − a
2
)2
=
Å
−a
»
(x− x0 − c)
2
+ (y− y0)
2
ã2 ⇒
c2 (x− x0)
2
− 2a2c (x− x0) + a
4 = a2
Ä
(x− x0 − c)
2
+ (y− y0)
2
ä⇒
c2 (x− x0)
2
− 2a2c (x− x0) + a
4 = a2
Ä
(x− x0)
2
− 2c (x− x0) + c
2 + (y− y0)
2
ä⇒
c2 (x− x0)
2
− 2a2c (x− x0) + a
4 = a2 (x− x0)
2
− 2a2c (x− x0) + a
2c2 + a2 (y− y0)
2 ⇒
c2 (x− x0)
2
+ a4 = a2 (x− x0)
2
+ a2c2 + a2 (y− y0)
2 ⇒(
a2 − b2
)
(x− x0)
2
+ a4 = a2 (x− x0)
2
+ a2
(
a2 − b2
)
+ a2 (y− y0)
2 ⇒
a2 (x− x0)
2
− b2 (x− x0)
2
+ a4 = a2 (x− x0)
2
+ a4 − a2b2 + a2 (y− y0)
2 ⇒
−b2 (x− x0)
2
= −a2b2 + a2 (y− y0)
2 ⇒
−b2(x−x0)
2
a2b2
= −a
2b2+a2(y−y0)
2
a2b2
⇒ −(x−x0)2
a2
= −1+ (y−y0)
2
b2
⇒
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 179 de 277 páginas
(x−x0)
2
a2
+ (y−y0)
2
b2
= 1 ,
como queŕıamos.
Particularmente, se no Exemplo 4.7 acima o centro da elipse estiver na origem do sistema de coordenadas, ou seja,
C (x0, y0) = (0, 0), então a equação cartesiana reduzida da elipse assume sua forma mais simples posśıvel:
x2
a2
+ y
2
b2
= 1
elipse
C
x
y
2b
2a
0
F1 F2
-c c
P
O próximo exemplo possui desenvolvimento análogo ao Exemplo 4.7 acima e será deixado como exerćıcio para o
leitor.
Exemplo 4.8 Mostremos que se uma elipse possui centro no ponto C (x0, y0), focos no eixo Oy ou em reta paralela
a Oy, eixo maior medindo 2a e eixo menor medindo 2b, então sua equação cartesiana é da forma
(x−x0)
2
b2
+ (y−y0)
2
a2
= 1 ,
elipse
C
x
y
2b
2a
y0
x0
F2
F1y0-c
y0+c
P
que, como vimos no Exemplo 4.7, também é chamada de equação reduzida da elipse .
Particularmente, se no Exemplo 4.8 acima o centro da elipse estiver na origem do sistema de coordenadas, ou seja,
C (x0, y0) = (0, 0), então a equação cartesiana reduzida da elipse, à semelhança do Exemplo 4.7, assume sua forma
mais simples posśıvel:
x2
b2
+ y
2
a2
= 1 .
elipse
C x
y
2b
2a
0
F2
F1-c
c
P
Observemos que as equações reduzidas da elipse se enquadram na equação geral que apresentamos. Por exemplo,
(x−x0)
2
a2
+ (y−y0)
2
b2
= 1⇒ x2−2x0x+x20
a2
+
y2−2y0y+y
2
0
b2
= 1⇒ 1
a2
x2 + 1
b2
y2 − 2x0
a2
x− 2y0
b2
y+
x20
a2
+
y20
b2
− 1 = 0,
que, comparada com Ax2 +Bxy+Cy2 +Dx+ Ey+ F = 0 nos fornece A = 1
a2
, B = 0, C = 1
b2
, D = −2x0
a2
, E = −2y0
b2
,
e F =
x20
a2
+
y20
b2
− 1.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 180 de 277 páginas UFU GAAL
Exemplo 4.9 (Corda focal mı́nima) Considere a elipse x
2
a2
+ y
2
b2
= 1. Vimos que a corda CC′, que passa por
um de seus focos e é perpendicular ao seu eixo maior, chama-se corda focal mı́nima ou latus rectum da elipse. Seu
comprimento, chamado de amplitude focal, é 2b
2
a
.
De fato, fazendo x = c na equação x
2
a2
+ y
2
b2
= 1 e lembrando que a2 = b2 + c2, temos
c2
a2
+ y
2
b2
= 1⇒ a2−b2
a2
+ y
2
b2
= 1⇒ y2
b2
= b
2
a2
⇒ y = ±b2
a
.
Portanto, os extremos da corda focal mı́nima podem ser C
Ä
c, b
2
a
ä
e C′
Ä
c,−b
2
a
ä
.
Logo, d (C,C′) =
…
(c− c)
2
+
Ä
b2
a
+ b
2
a
ä2
= 2b
2
a
, ou seja,
CC′ = 2b
2
a
.
elipse
x
y
C c y¢( ,- )
C c y( , )
F1
F c2( ,0)
Como é muito fácil de verificar, se a equação for x
2
b2
+ y
2
a2
= 1, o resultado é exatamente o mesmo.
Notemos que há duas cordas focais mı́nimas na elipse, uma para cada foco.
Por fim, de modo análogo à parábola, dentre todas as cordas da elipse que passam por um determinado foco, a
corda focal mı́nima é a que possui o menor comprimento. Não faremos essa demonstração aqui, pois, como vimos no
caso das parábolas, é necessário Cálculo Diferencial. Entretanto, os leitores que se interessarem pelo desafio, sugerimos
seguirem os mesmos passos que apresentamos no caso das parábolas.
4.3.4 Equação Cartesiana de Circunferência
A dedução da equação de uma circunferência de centro C (x0, y0) e raio r é uma aplicação direta da fórmula da
distância entre dois pontos. Portanto, fica como exerćıcio para o leitor a justificativa do próximo exemplo.
Exemplo 4.10 Mostre que se uma circunferência tem centro C (x0, y0) e raio r > 0, então sua equação cartesiana é
da forma
(x− x0)
2
+ (y− y0)
2
= r2 . circunferência
C
Pr
x
y
y0
x0
A equação acima é chamada de equação reduzida da circunferência .
4.3.5 Equação Cartesiana de Hipérbole
Exemplo 4.11 Mostremos que se uma hipérbole possui centro no ponto C (x0, y0), focos no eixo Ox ou em reta
paralela a Ox, eixo real medindo 2a e eixo imaginário medindo 2b, então sua equação cartesiana é da forma
(x−x0)
2
a2
− (y−y0)
2
b2
= 1 ,
hipérbole
C
x
y
2a
y0
x0
F2F1
x0-c x0+c
P
chamada de equação reduzida da hipérbole .
De fato, façamos F1 (x0 − c, y0), F2 (x0 + c, y0) como focos da hipérbole. Temos c
2 = a2 + b2.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 181 de 277 páginas
Seja P (x, y) um ponto qualquer da hipérbole. Pela sua definição geométrica:
|d (P, F1) − d (P, F2) | = 2a ⇒ ± (d (P, F1) − d (P, F2)) = 2a⇒ ±d (P, F1)∓ d (P, F2) = 2a⇒
±d (P, F1) = 2a± d (P, F2)⇒
±
»
(x− (x0 − c))
2
+ (y− y0)
2
= 2a±
»
(x− (x0 + c))
2
+ (y− y0)
2 ⇒Å
±
»
(x− x0 + c)
2
+ (y− y0)
2
ã2
=
Å
2a±
»
(x− x0 − c)
2
+ (y− y0)
2
ã2 ⇒
(x− x0 + c)
2
+ (y− y0)
2
= 4a2 ± 4a
»
(x− x0 − c)
2
+ (y− y0)
2
+ (x− x0 − c)
2
+ (y− y0)
2 ⇒
(x− x0)
2
+ 2c (x− x0) + c
2 = 4a2 ± 4a
»
(x− x0 − c)
2
+ (y− y0)
2
+ (x− x0)
2
− 2c (x− x0) + c
2 ⇒
2c (x− x0) = 4a
2 ± 4a
»
(x− x0 − c)
2
+ (y− y0)
2
− 2c (x− x0)⇒
c (x− x0) − a
2 = ±a
»
(x− x0 − c)
2
+ (y− y0)
2 ⇒(
c (x− x0) − a
2
)2
=
Å
±a
»
(x− x0 − c)
2
+ (y− y0)
2
ã2 ⇒
c2 (x− x0)
2
− 2a2c (x− x0) + a
4 = a2
Ä
(x− x0 − c)
2
+ (y− y0)
2
ä⇒
c2 (x− x0)
2
− 2a2c (x− x0) + a
4 = a2
Ä
(x− x0)
2
− 2c (x− x0) + c
2 + (y− y0)
2
ä⇒
c2 (x− x0)
2
− 2a2c (x− x0) + a
4 = a2 (x− x0)
2
− 2a2c (x− x0) + a
2c2 + a2 (y− y0)
2 ⇒
c2 (x− x0)
2
+ a4 = a2 (x− x0)
2
+ a2c2 + a2 (y− y0)
2 ⇒(
a2 + b2
)
(x− x0)
2
+ a4 = a2 (x− x0)
2
+ a2
(
a2 + b2
)
+ a2 (y− y0)
2 ⇒
a2 (x− x0)
2
+ b2 (x− x0)
2
+ a4 = a2 (x− x0)
2
+ a4 + a2b2 + a2 (y− y0)
2 ⇒
b2 (x− x0)
2
= a2b2 + a2 (y− y0)
2 ⇒ b2(x−x0)2
a2b2
= a
2b2+a2(y−y0)
2
a2b2
⇒ (x−x0)2
a2
= 1+ (y−y0)
2
b2
⇒
(x−x0)
2
a2
− (y−y0)
2
b2
= 1 ,
como queŕıamos.
Particularmente, se no Exemplo 4.11 acima o centro da hipérbole estiver na origem do sistema de coordenadas, ou
seja, C (x0, y0) = (0, 0), então a equação cartesiana reduzida da hipérbole assume sua forma mais simples posśıvel:
x2
a2
− y
2
b2
= 1 .
hipérbole
C x
y
2a
F2F1
-c c
P
0
O próximo exemplo possui desenvolvimento análogo ao Exemplo 4.11 acima e será deixado como exerćıcio para o
leitor.
Exemplo 4.12 Mostremos que se umaelipse possui centro no ponto C (x0, y0), focos no eixo Oy ou em reta paralela
a Oy, eixo real medindo 2a e eixo imaginário medindo 2b, então sua equação cartesiana é da forma
− (x−x0)
2
b2
+ (y−y0)
2
a2
= 1 ,
hipérbole
C
x
y
2a
y0
x0
F2
F1
y0-c
y0+c
P
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 182 de 277 páginas UFU GAAL
que, como vimos no Exemplo 4.12, também é chamada de equação reduzida da hipérbole .
Particularmente, se no Exemplo 4.12 acima o centro da hipérbole estiver na origem do sistema de coordenadas, ou
seja, C (x0, y0) = (0, 0), então a equação cartesiana reduzida da hipérbole, à semelhança do Exemplo 4.11, assume sua
forma mais simples posśıvel:
− x
2
b2
+ y
2
a2
= 1
hipérbole
C
x
y
2a
F2
F1-c
c
P
0
Exemplo 4.13 (Corda focal mı́nima) Considere a hipérbole x
2
a2
− y
2
b2
= 1. Vimos que a corda CC′, que passa por
um de seus focos e é perpendicular ao seu eixo real, chama-se corda focal mı́nima ou latus rectum da hiperbole. Seu
comprimento, chamado de amplitude focal, é 2b
2
a
.
De fato, fazendo x = c na equação x
2
a2
− y
2
b2
= 1 e lembrando que c2 = a2 + b2, temos
c2
a2
− y
2
b2
= 1⇒ a2+b2
a2
− y
2
b2
= 1⇒ y2
b2
= b
2
a2
⇒ y = ±b2
a
.
Portanto, os extremos da corda focal mı́nima podem ser C
Ä
c, b
2
a
ä
e C′
Ä
c,−b
2
a
ä
.
Logo, d (C,C′) =
…
(c− c)
2
+
Ä
b2
a
+ b
2
a
ä2
= 2b
2
a
, ou seja,
CC′ = 2b
2
a
.
hipérbole
F1
x
y
C c y¢( ,- )
C c y( , )
F c2( ,0)
Como é muito fácil de verificar, se a equação for − x
2
b2
+ y
2
a2
= 1, o resultado é exatamente o mesmo.
Notemos que há duas cordas focais mı́nimas na hipérbole, uma para cada foco.
Por fim, de modo análogo à parábola, dentre todas as cordas da hipérbole que passam por um determinado foco, a
corda focal mı́nima é a que possui o menor comprimento. Não faremos essa demonstração aqui, pois, como vimos no
caso das parábolas, é necessário Cálculo Diferencial. Entretanto, os leitores que se interessarem pelo desafio, sugerimos
seguirem os mesmos passos que apresentamos no caso das parábolas.
4.4 Caracterização de Curvas Cônicas Não Degeneradas em Termos de
Diretriz e Excentricidade
A proposição abaixo permite que possamos generalizar a definição geométrica de parábola de modo a englobar
elipses e hipérboles. Como consequência, essa proposição estabelece de modo natural a definição de reta diretriz para
uma elipse ou hipérbole, bem como permite definir a excentricidade de uma parábola como sendo 1.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 183 de 277 páginas
Proposição 4.2 Fixemos um plano π, uma reta d ⊂ π (que chamaremos de diretriz), um ponto F ∈ π tal que F /∈ d
(que chamaremos de foco) e um número e > 0 (que chamaremos de excentricidade). O lugar geométrico (conjunto) C
de todos os pontos P do plano π tais que
d(P, F) = ed(P,d )
é uma curva cônica.
Além disso:
(i) Se e = 1, então a curva cônica é uma parábola.
(ii) Se 0 < e < 1, então a curva cônica é uma elipse.
(iii) Se e > 1, então a curva cônica é uma hipérbole.
Reciprocamente, toda curva cônica não degenerada, que não seja uma circunferência, pode ser descrita por uma
equação da forma acima.
Observações importantes acerca da Proposição 4.2 acima:
(1) Para e = 1 temos a definição geométrica da parábola e a obtenção de sua equação cartesiana já foi objeto de
estudo.
Chamemos de δ = d (F, d ) e fixemos um Sistema de Coordenadas Cartesianas Ortogonais Oxy.
(2) Suponhamos 0 < e < 1. Para a obtenção de uma equação reduzida de elipse de excentricidade e , tomemos seu
centro na origem O (0, 0) e podemos, sem perda de generalidade, posicionar um dos focos no eixo Ox. Neste caso,
posicionamos os focos nos pontos F1 =
Ä
δe 2
e 2−1
, 0
ä
e F2 =
Ä
δe 2
1−e 2
, 0
ä
. A diretriz d será ortogonal ao eixo Ox e pode
ser posicionada em dois lugares distintos: à esquerda de F1 ou à direita de F2 (cuidado: só há uma diretriz!), e sua
equação é da forma x = δ
e 2−1
se estiver à esquerda de F1 (e, nesse caso, F = F1 na Proposição 4.2) ou x =
δ
1−e 2
se
estiver à direita de F2 (e, nesse caso, F = F2 na Proposição 4.2). Observe que nessas condições, d (F, d ) é, de fato, δ.
Desta forma, prova-se facilmente que
x2Ä
δe
1−e 2
ä2 + y2Ä
δe√
1−e 2
ä2 = 1
é a equação da elipse. Observe que a excentricidade dessa elipse é, de fato, e .
F1 F2
O
P
x
y
d
F1 F2
O
P
x
y
d
P¢ P¢
(3) Suponhamos e > 1. Para a obtenção de uma equação reduzida de hipérbole de excentricidade e , tomemos seu
centro na origem O (0, 0) e podemos, sem perda de generalidade, posicionar um dos focos no eixo Ox. Neste caso,
posicionamos os focos nos pontos F1 =
Ä
δe 2
1−e 2
, 0
ä
e F2 =
Ä
δe 2
e 2−1
, 0
ä
. A diretriz d será ortogonal ao eixo Ox e pode
ser posicionada em dois lugares distintos: à direita de F1 ou à esquerda de F2 (cuidado: só há uma diretriz!), e sua
equação é da forma x = δ
1−e 2
se estiver à direita de F1 ou x =
δ
e 2−1
se estiver à esquerda de F2 (observe que nessas
condições, d (F, d ) é, de fato, δ). Desta forma, prova-se facilmente que
x2Ä
δe
e 2−1
ä2 − y2Ä
δe√
e 2−1
ä2 = 1
é a equação da hipérbole. Observe que a excentricidade dessa hipérbole é, de fato, e .
F1 F2O
P
x
yd
F1 F2O
P
x
y d
P¢ P¢
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
GAAL UFU Página 219 de 277 páginas
Caṕıtulo 5
Superf́ıcies
As ideias de superf́ıcie e área são bastante correlatas no senso comum, uma vez que, sobre superf́ıcies, é posśıvel
o cálculo de áreas. Não iremos definir formalmente o que se entende por superf́ıcie de um modo geral, pois para isso
seriam necessários conhecimentos matemáticos mais avançados do que aqueles que prentendemos abordar nessas notas.
Entretanto, dentre todas as superf́ıcies, há algumas famı́lias que merecem destaque: são as chamadas superf́ıcies de
revolução, superf́ıcies ciĺındricas, superf́ıcies cônicas e superficies quádricas que passamos a descrever.
5.1 Definições Geométricas de Algumas Superf́ıcies
Assim como nas curvas cônicas, algumas superf́ıcies podem ser facilmente definidas geometricamente.
5.1.1 Superf́ıcies de Revolução
Sejam g uma curva qualquer e e uma reta contidos em um plano (1). A superf́ıcie descrita pela curva g no
espaço, quando esta é girada 360◦ em torno da reta e, é chamada de superf́ıcie de revolução.
A reta e é chamada de eixo da superf́ıcie de revolução enquanto que qualquer uma das curvas descritas por g
no espaço é chamada de geratriz ou meridiano da superf́ıcie de revolução.
As intersecções de uma superf́ıcie de revolução com planos ortogonais ao seu eixo são chamadas de paralelos
da superf́ıcie de revolução.
Observemos que paralelos de superf́ıcie de revolução são sempre circunferências.
g
360o
e
superfície de revolução
A definição acima permite a geração de algumas “superf́ıcies de revolução degeneradas” que não tem muito interesse
em nossos estudos como, por exemplo, quando e = g, ou quando a intersecção de g como e possui segmentos de reta.
Observemos que planos enquadram-se na definição acima e podem ser considerados como “superf́ıcies de revolução
degeneradas”. Para tanto, basta tomar g e e perpendiculares.
1A rigor, não é imprescind́ıvel que g seja uma curva plana. A suposição de que g seja plana tem por objetivo tornar a definição mais
intuitiva.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 220 de 277 páginas UFU GAAL
5.1.2 Superf́ıcies Ciĺındricas
Sejam c uma curva qualquer contida em um plano π e g uma reta ortogonal a π que intersecta c (2). O lugar
geométrico (conjunto) de todas as retas paralelas a g passando por pontos de cé chamado de superf́ıcie ciĺındrica.
Qualquer uma das retas da superf́ıcie ciĺındrica que seja paralela a g é chamada de geratriz da superf́ıcie
ciĺındrica.
Qualquer uma das cópias de c contidas na superf́ıcie ciĺındrica é chamada de secção reta da superf́ıcie ciĺındrica.
c
g
p superfície
cilíndrica
Observemos que se c for uma circunferência, temos um cilindro de revolução (que é um caso particular de superf́ıcie
de revolução).
Assim como no caso de das superf́ıcies de revolução, há “superf́ıcies ciĺındricas degeneradas” como, por exemplo,
quando c é uma reta. Neste caso a superf́ıcie ciĺındrica seria um plano.
Por fim, observemos que, de acordo com nossa definição, uma superf́ıcie ciĺındrica não é limitada, pois uma reta
não é limitada.
5.1.3 Superf́ıcies Cônicas
Sejam c uma curva qualquer contida em um plano π e V um ponto fora de π (3). O lugar geométrico (conjunto)
de todas as retas que passam por V e por um ponto de c é chamada de superf́ıcie cônica. O ponto V é chamado
de vértice da superf́ıcie cônica e qualquer uma de suas retas é chamada de geratriz da superf́ıcie cônica.
Observemos que uma superf́ıcie cônica possui duas “folhas”, separadas pelo vértice V.
c
V
superfície
cônica
p
g
Observemos que se c for uma circunferência e a projeção ortogonal de V sobre o plano da circunferência coincidir
com seu centro, temos um cone circular duplo (que é um caso particular de superf́ıcie de revolução).
Assim como no caso das superf́ıcies de revolução, há “superf́ıcies cônicas degeneradas” como, por exemplo, quando
c é uma reta. Neste caso a superf́ıcie cônica seria um plano menos duas semirretas.
Por fim, observemos que, de acordo com nossa definição, uma superf́ıcie cônica não é limitada, pois uma reta não
é limitada.
2Assim como em superf́ıcies de rotação, não é imprescind́ıvel que c seja uma curva plana. A suposição de que c seja plana tem por
objetivo tornar a definição mais intuitiva.
3Como nas duas definições anteriores, não é imprescind́ıvel que c seja uma curva plana. A suposição de que c seja plana tem por objetivo
tornar a definição mais intuitiva.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 221 de 277 páginas
5.1.4 Esferas
Sejam C um ponto no espaço e r > 0 um número real. O lugar geométrico (conjunto) dos pontos do espaço que
estão à distância r de C é chamado de esfera de centro C e raio r.
C
P
r
esfera
Observemos que uma esfera pode ser enxergada como superf́ıcie de revolução. Para tanto, na definição de superf́ıcie
de revolução, basta tomar g como sendo uma circunferência e e como sendo uma reta passando por seu centro.
5.2 Superf́ıcies Quádricas
Uma famı́lia important́ıssima de superf́ıcies são as chamadas superf́ıcies quádricas. Elas são definidas a partir de
uma equação cartesiana e, portanto, devemos fixar Oxyz sistema de coordenadas cartesianas ortogonais no espaço.
O lugar geométrico (conjunto) de todos os pontos P (x, y, z) do espaço cartesiano que satisfazem a equação
quadrática geral com três variáveis e coeficientes reais
Ax2 + By2 + Cz2 +Dxy+ Exz+ Fyz+Gx+Hy+ Iz+ J = 0 ,
sendo que algum número real A, B, C, D, E ou F é não nulo (para que a equação seja, de fato, quadrática), é
chamado de superf́ıcie quádrica.
Assim como as curvas cônicas, há “superf́ıcies quádricas degeneradas”. Por exemplo, se A = B = C = 1 e
D = E = F = G = H = I = J = 0, ou seja, x2 + y2 + z2 = 0, então a superf́ıcie quádrica se reduz a um único ponto (a
origem O (0, 0, 0) do sistema de coordenadas).
Não vamos fazer um estudo completo de classificação de superf́ıcies quádricas neste texto. Entretanto, algumas
dessas superf́ıcies são muito importantes em diversas aplicações, principalmente por suas propriedades de reflexão,
conforme veremos adiante. São estas superf́ıcies que passaremos a descrever nas próximas subseções e veremos que
casos particulares de alguns tipos de superf́ıcies, já vistas na seção anterior, voltarão a aparecer como, por exemplo,
cilindros e cones.
Antes, porém, uma observação importante que é comum às superf́ıcies que estudaremos, com exceção do cone:
Quando consideramos uma equação quadrática cartesiana, como sabemos que a superf́ıcie que ela representa é conforme
a ilustramos? Ou seja: lisa, suave, sem bicos, sem pontas, sem quinas, sem dobras, sem rugas, sem rasgos (buracos)?
Para justificar que o formato da superf́ıcie é, de fato, do modo como a ilustramos precisamos, novamente, de Cálculo
Diferencial. Isso significa que o leitor vai ter que ter paciência e esperar mais um pouco, até concluir um curso de
Cálculo. Com as noções de derivadas parciais e planos tangentes estabelecidas, é posśıvel justificar que elas são, de
fato, superf́ıcies suaves.
Estamos tirando o cone da observação acima porque ele possui um vértice que é do tipo “bico”. Entretanto, com
exceção do vértice, o cone de equação quadrática também é suave.
Observamos que não t́ınhamos essa preocupação com o formato suave das superf́ıcies na seção anterior porque
estávamos definindo-as de forma geométrica, ou seja, a partir de objetos geométricos dados como planos, curvas, retas
e pontos. Todavia, quando partimos de uma equação algébrica com três variáveis, geralmente não é trivial saber como
é o formato da superf́ıcie que ela representa. Dáı a importância dos comentários que fizemos acima.
Por fim, enfatizamos que todas as equações cartesianas que iremos apresentar nesta seção se enquadram, de fato, na
equação quadrática geral apresentada acima. Faremos essa verificação no caso do cilindro eĺıptico que apresentaremos
abaixo, encontrando os coeficientes de A até J. As demais equações serão deixadas para que o leitor identifique os
coeficientes.
5.2.1 Equações Cartesianas Reduzidas de Algumas Superf́ıcies Quádricas Especiais
É posśıvel termos superf́ıcies ciĺındricas, cônicas e esféricas como casos particulares de superf́ıcies quádricas. Mas
muita atenção: nem toda superf́ıcie ciĺındrica ou cônica é superf́ıcie quádrica.
Vamos estudá-las por meio dos próximos exemplos.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 222 de 277 páginas UFU GAAL
Exemplo 5.1 (Cilindros Eĺıpticos) Consideremos a superf́ıcie quádrica dada pela equação
(y−y0)
2
b2
+ (z−z0)
2
c2
= 1 ,
sendo y0, z0, b, c números reais fixos com b, c > 0.
Trata-se, de fato, de uma superf́ıcie quádrica pois
(y−y0)
2
b2
+ (z−z0)
2
c2
= 1⇒ 1
b2
y2 + 1
c2
z2 − 2y0
b2
y− 2z0
c2
z+
y20
b2
+
z20
c2
− 1 = 0,
o que significa A = 0, B = 1
b2
, C = 1
c2
, D = E = F = G = 0, H = −2y0
b2
, I = −2z0
c2
e J =
y20
b2
+
z20
c2
− 1 na equação geral
de superf́ıcie quádrica.
A superf́ıcie quádrica dada pela equação acima recebe o nome de cilindro eĺıptico de eixo paralelo ao eixo
coordenado Ox passando pelo ponto A (0, y0, z0) (primeira figura abaixo).
O adjetivo “eĺıptico” se deve ao fato de que, ao seccionarmos o cilindro por planos de equações x = k (constante)
paralelos ao plano coordenado Oyz, obtemos elipses de equações (y−y0)
2
b2
+ (z−z0)
2
c2
= 1 nesses planos de secção
(adotando, é claro, um sistema de coordenadas Oyz em cada um desses planos).
(y−y0)
2
b2
+ (z−z0)
2
c2
= 1 (x−x0)
2
a2
+ (z−z0)
2
c2
= 1 (x−x0)
2
a2
+ (y−y0)
2
b2
= 1
Se considerarmos a equação
(x−x0)
2
a2
+ (z−z0)
2
c2
= 1 ,
sendo x0, z0, a, c números reais fixos com a, c > 0, temos um cilindro eĺıptico de eixo paralelo ao eixo coordenado
Oy passando pelo ponto A (x0, 0, z0) (segunda figura acima).
Se considerarmos a equação
(x−x0)
2
a2
+ (y−y0)
2
b2
= 1 ,
sendo x0, y0, a, b números reais fixos com a, b > 0, temos um cilindro eĺıptico de eixo paralelo ao eixo coordenado
Oz passando pelo ponto A (x0, y0, 0) (terceira figuraacima).
Casos particulares muito importantes de cilindros eĺıpticos ocorrem quando os eixos coincidem com os eixos coor-
denados. Neste caso, x0 = y0 = z0 = 0 e as equações se reduzem a
y2
b2
+ z
2
c2
= 1, x
2
a2
+ z
2
c2
= 1 e x
2
a2
+ y
2
b2
= 1.
Por fim, quando a = b = c = r nas equações que apresentamos, temos, na verdade, cilindros de revolução de
raio r. Neste caso, as secções que discutimos acima são ćırculos, e não elipses. Na figura abaixo temos um cilindro de
revolução com eixo Oz.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 223 de 277 páginas
360o
z
cilindro de revolução
O
y
x
r
P x( , , )y z
Observações.
• (1) Quando uma equação cartesiana como, por exemplo, x
2
2
+ y
2
5
= 1 é apresentada, como sabemos tratar-se de
uma elipse (curva) ou de um cilindro eĺıptico (superf́ıcie)? Esta equação representa esses dois objetos... Neste caso,
a informação sobre a natureza do objeto tem que ser dada no enunciado. Entretanto, há uma tendência de se pensar
na eĺıpse, e não no cilindro, porque na equação só aparecem duas variáveis, e não três. Quando essa equação estiver
associada a um cilindro, temos que tem mente que a variável z que está “faltando” pode assumir qualquer valor.
Lembre-se também que superf́ıcies “moram” no espaço e, portanto, seus pontos possuem três variáveis (coordenadas),
ou seja, são da forma P (x, y, z). Se for mais agradável ao aprendizado, lembre-se que a variável z está multiplicada
por zero na equação fornecida.
• (2) Cilindros eĺıpticos (ou de revolução) são casos particulares de superf́ıcies ciĺındricas, conforme as definimos
geometricamente na seção anterior. Neste caso, a curva c que define a superf́ıcie ciĺındrica é uma elipse (ou ćırculo).
Exemplo 5.2 (Cones Eĺıpticos) Consideremos a superf́ıcie quádrica dada pela equação
(x−x0)
2
a2
= (y−y0)
2
b2
+ (z−z0)
2
c2
,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0.
A superf́ıcie quádrica dada pela equação acima recebe o nome de cone eĺıptico de vértice V (x0, y0, z0) e eixo
paralelo ao eixo coordenado Ox (primeira figura abaixo). O eixo do cone eĺıptico sempre passa pelo vértice.
O adjetivo “eĺıptico” se deve ao fato de que, ao seccionarmos o cone por planos de equações x = k 6= x0 (constante)
paralelos ao plano coordenado Oyz, obtemos elipses de equações (y−y0)
2
((k−x0)b/a)
2 +
(z−z0)
2
((k−x0)c/a)
2 = 1 nesses planos de
secção (adotando, é claro, um sistema de coordenadas Oyz em cada um desses planos).
(x−x0)
2
a2
= (y−y0)
2
b2
+ (z−z0)
2
c2
(y−y0)
2
b2
= (x−x0)
2
a2
+ (z−z0)
2
c2
(z−z0)
2
c2
= (x−x0)
2
a2
+ (y−y0)
2
b2
Se considerarmos a equação
(y−y0)
2
b2
= (x−x0)
2
a2
+ (z−z0)
2
c2
,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, temos um cone eĺıptico de vértice V (x0, y0, z0) de eixo
paralelo ao eixo coordenado Oy (segunda figura acima).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 224 de 277 páginas UFU GAAL
Se considerarmos a equação
(z−z0)
2
c2
= (x−x0)
2
a2
+ (y−y0)
2
b2
,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, temos um cone eĺıptico de vértice V (x0, y0, z0) de eixo
paralelo ao eixo coordenado Oz (terceira figura acima).
Casos particulares muito importantes de cones eĺıpticos ocorrem quando os eixos coincidem com os eixos coorde-
nados e o vértice está na origem, ou seja, V (x0, y0, z0) = (0, 0, 0) e as equações se reduzem a
x2
a2
= y
2
b2
+ z
2
c2
, y
2
b2
= x
2
a2
+ z
2
c2
e z
2
c2
= x
2
a2
+ y
2
b2
.
Por fim, quando b = c na primeira equação, a = c na segunda equação e a = b na terceira equação das equações
que apresentamos, temos, na verdade, cones de revolução. Neste caso, as secções que discutimos acima são ćırculos,
e não elipses. Na figura abaixo temos um cone de revolução de vértice na origem e eixo Oz.
360o
q
z
O
y
x
cone de revolução
P x( , , )y z
Observação. Cones eĺıpticos (ou de revolução) são casos particulares de superf́ıcies cônicas, conforme as definimos
geometricamente na seção anterior. Neste caso, a curva c que define a superf́ıcie cônica é uma elipse (ou ćırculo).
Exemplo 5.3 (Esferas) Da definição geométrica de esfera que vimos na seção anterior, podemos deduzir a sua
equação cartesiana, lembrando da fórmula de distância entre dois pontos no espaço. Vejamos como fazer isso.
Sejam C (x0, y0, z0) ponto fixo no espaço e r > 0. Consideremos os pontos P (x, y, z) no espaço que estão à distância
r de C. Logo,
d (P,C) = r⇒»(x− x0)2 + (y− y0)2 + (z− z0)2 = r⇒ (x− x0)2 + (y− y0)2 + (z− z0)2 = r2 ,
que é a equação cartesiana da esfera de centro C (x0, y0, z0) e raio r.
(x− x0)
2
+ (y− y0)
2
+ (z− z0)
2
= r2
r
esfera
z
O y
x
C
P x( , , )y z
x0
y0
z0
Em particular, quando x0 = y0 = z0 = 0, temos a esfera com centro na origem, de equação quadrática
x2 + y2 + z2 = r2 .
5.2.2 Equação Cartesiana Reduzida de Elipsoide
Vamos continuar introduzindo tipos especiais de superf́ıcies quádricas por meio de exemplos. A próxima superf́ıcie
pode ser encarada como sendo uma espécie de generalização das elipses para o espaço.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 225 de 277 páginas
Exemplo 5.4 A superf́ıcie de equação quadrática
(x−x0)
2
a2
+ (y−y0)
2
b2
+ (z−z0)
2
c2
= 1 ,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, é chamada de elipsoide com centro no ponto C (x0, y0, z0).
Os pontos A1 (x0 + a, y0, z0), A2 (x0 − a, y0, z0), B1 (x0, y0 + b, z0), B2 (x0, y0 − b, z0), C1 (x0, y0, z0 + c) e
C2 (x0, y0, z0 − c) são chamados de vértices do elipsoide.
Os segmentos A1A2, B1B2 e C1C2 são chamados de eixos do elipsoide e são paralelos aos eixos coordenados.
a > b, c b > a, c c > a, b
A equação considerada acima recebe o nome de equação cartesiana reduzida do elipsoide.
Um caso particular bastante comum é quando o centro do elipsoide está na origem do sistema de coordenadas, ou
seja, C (0, 0, 0). Neste caso, a equação reduzida assume o seguinte formato:
x2
a2
+ y
2
b2
+ z
2
c2
= 1 ,
e os vértices são os pontos A1 (a, 0, 0), A2 (−a, 0, 0), B1 (0, b, 0), B2 (0,−b, 0), C1 (0, 0, c) e C2 (0, 0,−c), conforme
podemos observar na figura abaixo.
z
y
x
a b
c
-c
-a
-b
C
elipsoides com centros na origem
A1
A2
B2 B1
C2
C1
Observações:
• (1) Se a, b e c forem todos distintos, então a intersecção de um elipsoide com planos paralelos aos planos coordenados,
que não tangenciem os seus vértices, são elipses (dáı o nome elipsoide). Mas atenção: quando estudamos as elipses, a
constante a era sempre maior do que a constante b, algo que não ocorre aqui. Estamos utilizando as mesmas letras a
e b no elipsoide, mas sem a relação de ordem que t́ınhamos nas elipses.
• (2) Se a = b, então o elipsoide pode ser visto como uma superf́ıcie de revolução com eixo paralelo ao eixo coordenado
Oz, ou seja, um elipsoide circular (ou de revolução). Analogamente, se a = c ou b = c.
• (3) Se a = b = c = r, o elipsoide é, na verdade, uma esfera com centro em C (x0, y0, z0) e raio r, pois sua equação
pode ser colocada na forma (x− x0)
2
+ (y− y0)
2
+ (z− z0)
2
= r2.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 226 de 277 páginas UFU GAAL
Algumas Aplicações dos Elipsoides
Há algumas aplicações práticas bastante interessantes quando consideramos certos tipos de elipsoides de re-
volução.
Um elipsoide de revolução pode ser pensado como rotação de uma elipse em torno de um de seus eixos. Em
particular, podemos considerar um elipsóide de revolução gerado por uma elipse que gira em torno de seu eixo
maior (o elipsoide fica,portanto, parecido com uma daquelas melancias meio alongadas...). Esse eixo maior da
elipse que gerou o elipsoide de revolução será chamado, também, de eixo maior do elipsoide de revolução.
O que há de especial em um tal elipsoide de revolução?
Primeiramente, observemos que todas as elipses geratrizes de um elipsoide de revolução são congruentes, ou seja,
todas as elipses que são intersecções do elipsoide com planos que passam por seu eixo maior são congruentes. Isto
permite que possamos definir exatamente dois focos para um elipsoide de revolução sobre seu eixo maior. Esses
dois focos são exatamente os dois focos de qualquer uma das elipses geratrizes. Vamos chamar de Foco 1 e Foco
2 os dois focos de um elipsoide de revolução sobre seu eixo maior.
Em seguida, devemos nos lembrar das propriedades de reflexão das elipses, vistas no Caṕıtulo 4 (Curvas), que já
estudamos: Um raio de luz sai de um foco, reflete na elipse e passa pelo outro foco. Com um elipsoide de revolução
em torno do eixo maior ocorre a mesma coisa: Um raio de luz sai de um foco, reflete no elipsoide e passa pelo outro
foco. Isto significa eu podemos concentrar ondas proveniente de um ponto em outro ponto.
Essa propriedade reflexiva das elipses, que é transportada para o elipsoide de revolução em torno de seu eixo
maior, possui algumas aplicações:
(1) Na Cadeira Odontológica
Sim. Aquele refletor irritante que o dentista usa quando está tratando de seu dente funciona de acordo com
o prinćıpio que descrevemos acima. Neste caso, o espelho do refletor tem formato que é um pedaço de elipsoide
de revolução em torno seu eixo maior. A lâmpada fica em um dos focos e o dentista posiciona do refletor de tal
modo que o dente a ser tratado fique no outro foco. Toda a luz é direcionada para o espelho do refletor por meio
de um anteparo em formato de uma pequena capa circular que é colocada na parte superior da lâmpada (é aquela
parte central do refletor que podemos ver na figura abaixo à esquerda). Graças a esse anteparo o paciente não
enxerga diretamente a lâmpada, proporcionando conforto visual durante o tratamento. Depois de refletida, a luz
fica concentrada no outro foco.
Na figura abaixo, na parte central, temos o espelho do refletor. O furo central é por onde passa o soquete da
lâmpada. Essa peça pode ser recortada em diferentes formatos, de acordo com a caixa do refletor, mas sua superf́ıcie
é sempre parte de um elipsoide de revolução em torno de seu eixo maior. Por fim, na figura abaixo do lado direito,
temos um esquema de funcionamento do prinćıpio de reflexão na própria cadeira odontológica.
lâmpada: Foco 1
dente: Foco 2
refletor
G.A. na cadeira do dentista ...
Encorajamos o leitor a procurar na Internet fotos de pacientes em cadeiras odontológicas com a luz do refletor
acesa. É posśıvel perceber o quanto a intersidade luminosa é forte no foco que fica sobre o dente. Não colocamos
tais fotos aqui por motivos de direitos autorais.
(2) Fragmentação de Cálculos Renais
Há um procedimento médico chamado de litotripsia (do grego: lithos = pedra + tripsis = esmagamento ou
trituração) para tratamento não invasivo de cálculos renais (pedras nos rins). O prinćıpio é o mesmo que descrevemos
no item acima. Porém, ao invés de luz, geralmente são utilizadas ondas sonoras (ultrassons). Em um dos focos é
colocado um gerador de ultrassons e no outro foco o cálculo (que está dentro do rim). As ondas sonoras, depois de
refletidas na superf́ıcie do elipsoide, se concentram no cálculo e atuam como ondas de choque, fazendo-o fragmentar-
se. O aparelho que faz esse tipo de procedimento é chamado de litotriptor. Há tipos diferentes de litotriptores,
inclusive aqueles que funcionam em ambiente aquoso. Há também litotriptores que utilizam laser ou, então, ondas
eletromagnéticas no lugar de ultrassons. As figuras abaixo ilustram o prinćıpio.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 227 de 277 páginas
Mais uma vez, convidamos o leitor a pesquisar na Internet sobre o assunto. Nas páginas da Wikipedia há resumos
fáceis de serem compreendidos sobre o tema. Há também diversas fotos de pessoas recebendo o tratamento e que
ajudam a compreender o processo.
5.2.3 Equação Cartesiana Reduzida de Hiperboloide
Assim como o elipsoide é uma espécie de generalização das elipses para o espaço, as superf́ıcies chamadas hiperbo-
loides são, também, uma espécie de generalização das hipérboles para o espaço. Entretanto, no caso dos hiperboloides,
temos dois casos a serem estudados: o hiperboloide de uma folha e o hiperboloide de duas folhas. Vamos introduźı-los
por meio de exemplos.
Hiperboloide de Uma Folha
Exemplo 5.5 A superf́ıcie de equação quadrática
− (x−x0)
2
a2
+ (y−y0)
2
b2
+ (z−z0)
2
c2
= 1 ,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, é chamada de hiperboloide de uma folha com centro
no ponto C (x0, y0, z0) (primeira figura abaixo).
Os pontos A1 (x0, y0 + b, z0), A2 (x0, y0 − b, z0), B1 (x0, y0, z0 + c), B2 (x0, y0, z0 − c) são chamados de vértices
do hiperboloide de uma folha.
A reta paralela ao eixo coordenado Ox que passa pelo centro C (x0, y0, z0) é chamada de eixo do hiperboloide de
uma folha.
− (x−x0)
2
a2
+ (y−y0)
2
b2
+ (z−z0)
2
c2
= 1 (x−x0)
2
a2
− (y−y0)
2
b2
+ (z−z0)
2
c2
= 1 (x−x0)
2
a2
+ (y−y0)
2
b2
− (z−z0)
2
c2
= 1
Se considerarmos a equação
(x−x0)
2
a2
− (y−y0)
2
b2
+ (z−z0)
2
c2
= 1 ,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, temos um hiperboloide de uma folha de centro
C (x0, y0, z0) e de eixo paralelo ao eixo coordenadoOy (segunda figura acima). Os vértices são os pontosA1 (x0 + a, y0, z0),
A2 (x0 − a, y0, z0), B1 (x0, y0, z0 + c), B2 (x0, y0, z0 − c).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 228 de 277 páginas UFU GAAL
Se considerarmos a equação
(x−x0)
2
a2
+ (y−y0)
2
b2
− (z−z0)
2
c2
= 1 ,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, temos um hiperboloide de uma folha de centro
C (x0, y0, z0) e de eixo paralelo ao eixo coordenadoOz (terceira figura acima). Os vértices são os pontosA1 (x0 + a, y0, z0),
A2 (x0 − a, y0, z0), B1 (x0, y0 + b, z0), B2 (x0, y0 − b, z0).
As equações consideradas acima recebem o nome de equações cartesianas reduzidas dos hiperboloides de uma
folha.
Casos particulares muito importantes de hiperboloides de uma folha ocorrem quando os eixos coincidem com os
eixos coordenados e o centro está na origem, ou seja, C (x0, y0, z0) = (0, 0, 0) e as equações se reduzem a
− x
2
a2
+ y
2
b2
+ z
2
c2
= 1, x
2
a2
− y
2
b2
+ z
2
c2
= 1 e x
2
a2
+ y
2
b2
− z
2
c2
= 1.
Na figura abaixo temos hiperboloides de uma folha com centros na origem e eixos Oz. O vértices são os pontos
A1 (a, 0, 0), A2 (−a, 0, 0), B1 (0, b, 0) e B2 (0,−b, 0).
hiperboloides de uma folha com centros na origem e eixos Oz
z
y
-a
ax
-b b
Observações:
• (1) A designação “uma folha” para o hiperboloide estudado acima se deve ao fato da superf́ıcie ser conexa, ou
seja, dados dois pontos quaisquer no hiperboloide de uma folha, sempre é possivel ligá-los por meio de uma curva
inteiramente contida no hiperboloide.
• (2) A intersecção de um hiperboloide de uma folha com planos paralelos ao seu eixo e a um plano coordenado, que
não tangenciem os seus vértices, são hipérboles (dáı o nome hiperboloide). A interseção de um hiperboloide de uma
folha com planos ortogonais ao seu eixo são elipses (ou ćırculos, caso o hiperboloide seja de revolução).
• (3) Quando os denominadores dos termos positivos da equação reduzida de um hiperboloide de uma folha forem
iguais, então o hiperboloide de uma folha pode ser visto como uma superf́ıcie de revolução em torno de seu próprio
eixo, ou seja, um hiperboloide de uma folha circular (ou derevolução).
Hiperboloide de Duas Folhas
Exemplo 5.6 A superf́ıcie de equação quadrática
(x−x0)
2
a2
− (y−y0)
2
b2
− (z−z0)
2
c2
= 1 ,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, é chamada de hiperboloide de duas folhas com centro
no ponto C (x0, y0, z0) (primeira figura abaixo).
Os pontos A1 (x0 + a, y0, z0) e A2 (x0 − a, y0, z0) são chamados de vértices do hiperboloide de duas folhas.
A reta que passa pelos vértices (e, portanto, pelo centro) é chamada de eixo do hiperboloide de duas folhas.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 229 de 277 páginas
(x−x0)
2
a2
− (y−y0)
2
b2
− (z−z0)
2
c2
= 1 − (x−x0)
2
a2
+ (y−y0)
2
b2
− (z−z0)
2
c2
= 1 − (x−x0)
2
a2
− (y−y0)
2
b2
+ (z−z0)
2
c2
= 1
Se considerarmos a equação
− (x−x0)
2
a2
+ (y−y0)
2
b2
− (z−z0)
2
c2
= 1 ,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, temos um hiperboloide de duas folhas de cen-
tro C (x0, y0, z0) e de eixo paralelo ao eixo coordenado Oy (segunda figura acima). Os vértices são os pontos
A1 (x0, y0 + b, z0) e A2 (x0, y0 − b, z0).
Se considerarmos a equação
− (x−x0)
2
a2
− (y−y0)
2
b2
+ (z−z0)
2
c2
= 1 ,
sendo x0, y0, z0, a, b, c números reais fixos com a, b, c > 0, temos um hiperboloide de duas folhas de cen-
tro C (x0, y0, z0) e de eixo paralelo ao eixo coordenado Oz (terceira figura acima). Os vértices são os pontos
A1 (x0, y0, z0 + c) e A2 (x0, y0, z0 − c).
As equações consideradas acima recebem o nome de equações cartesianas reduzidas dos hiperboloides de duas
folhas.
Casos particulares muito importantes de hiperboloides de duas folhas ocorrem quando os eixos coincidem com os
eixos coordenados e o centro está na origem, ou seja, C (x0, y0, z0) = (0, 0, 0) e as equações se reduzem a
x2
a2
− y
2
b2
− z
2
c2
= 1, − x
2
a2
+ y
2
b2
− z
2
c2
= 1 e − x
2
a2
− y
2
b2
+ z
2
c2
= 1.
Na figura abaixo temos hiperboloides de duas folhas com centros na origem e eixos Oz. O vértices são os pontos
A1 (0, 0, c) e A2 (0, 0,−c).
z
y
x -c
c
hiperboloides de duas folhas com centros na origem e eixos Oz
Observações:
• (1) A designação “duas folhas” para o hiperboloide estudado acima se deve ao fato da superf́ıcie possuir duas partes
disjuntas, sendo que cada parte é uma superf́ıcie conexa, conforme definimos no primeiro item das observações do
hiperboloide de uma folha.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 230 de 277 páginas UFU GAAL
• (2) A intersecção de um hiperboloide de duas folhas com planos paralelos ao seu eixo e a um plano coordenado
são hipérboles (dáı o nome hiperboloide). A interseção (não vazia) de um hiperboloide de duas folhas com planos
ortogonais ao seu eixo e que não passe por seus vértices são elipses (ou ćırculos, caso o hiperboloide seja de revolução).
• (3) Quando os denominadores dos termos negativos da equação reduzida de um hiperboloide de duas folhas forem
iguais, então o hiperboloide de duas folhas pode ser visto como uma superf́ıcie de revolução em torno de seu próprio
eixo, ou seja, um hiperboloide de duas folhas circular (ou de revolução).
5.2.4 Equação Cartesiana Reduzida de Paraboloide
Assim como o elipsoide e os hiperboloides são uma espécie de generalização das elipses e hipérboles para o espaço,
as superf́ıcies chamadas paraboloides são, também, uma espécie de generalização das parábolas para o espaço. Como
no caso dos hiperboloides, há dois tipos de paraboloides a serem estudados: o paraboloide eĺıptico e o paraboloide
hiperbólico. Vamos introduźı-los por meio de exemplos.
Paraboloide Eĺıptico
Exemplo 5.7 A superf́ıcie de equação quadrática
x−x0
a
= (y−y0)
2
b2
+ (z−z0)
2
c2
,
sendo x0, y0, z0, a, b, c números reais fixos com a 6= 0 e b, c > 0, é chamada de paraboloide eĺıptico (primeira figura
abaixo).
O ponto V (x0, y0, z0) é chamado de vértice do parboloide eliptico.
A reta paralela ao eixo coordenado Ox que passa pelo vértice V (x0, y0, z0) é chamada de eixo do paraboloide
eĺıptico.
Quando a > 0, dizemos que a concavidade do paraboloide eliptico é voltada para o sentido positivo do eixo
coordenado Ox. Quando a < 0, a concavidade é voltada para o sentido negativo do eixo coordenado Ox.
x−x0
a
= (y−y0)
2
b2
+ (z−z0)
2
c2
y−y0
b
= (x−x0)
2
a2
+ (z−z0)
2
c2
z−z0
c
= (x−x0)
2
a2
+ (y−y0)
2
b2
Se considerarmos a equação
y−y0
b
= (x−x0)
2
a2
+ (z−z0)
2
c2
,
sendo x0, y0, z0, a, b, c números reais fixos com b 6= 0 e a, c > 0, temos um parabolóide eĺıptico de vértice
V (x0, y0, z0) e de eixo paralelo ao eixo coordenado Oy (segunda figura acima).
Se considerarmos a equação
z−z0
c
= (x−x0)
2
a2
+ (y−y0)
2
b2
,
sendo x0, y0, z0, a, b, c números reais fixos com c 6= 0 e a, b > 0, temos um paraboloide eĺıptico de vértice
V (x0, y0, z0) e de eixo paralelo ao eixo coordenado Oz (terceira figura acima).
As equações consideradas acima recebem o nome de equações cartesianas reduzidas dos paraboloides eĺıpticos.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 231 de 277 páginas
Casos particulares muito importantes de paraboloides eĺıpticos ocorrem quando os eixos coincidem com os eixos
coordenados e o vértice está na origem, ou seja, V (x0, y0, z0) = (0, 0, 0) e as equações se reduzem a
x
a
= y
2
b2
+ z
2
c2
, y
b
= x
2
a2
+ z
2
c2
e z
c
= x
2
a2
+ y
2
b2
.
Na figura abaixo temos paraboloides eĺıpticos com eixos Oz e vértices na origem.
V
z
y
x
paraboloides elípticos com vértices na origem e eixos Oz
Observações:
• (1) A intersecção de um paraboloide eliptico com planos paralelos ao seu eixo, e a um plano coordenado, são parábolas
(dáı o nome paraboloide). A interseção de um paraboloide eĺıptico com planos ortogonais ao seu eixo são elipses (ou
ćırculos, caso o paraboloide seja de revolução).
Nas figuras abaixo temos intersecções de um parabolóide eĺıptico de eixo z com planos paralelos aos planos coor-
denados Oxz e Oyz. Tais intersecções são parábolas. Se a e b forem distintos, as intersecções não vazias desse mesmo
parabolóide com planos ortogonais ao eixo Oz, e que não contenha seu vértice, são elipses (dáı o adjetivo eĺıptico que
acompanha o nome paraboloide).
• (2) Quando os denominadores dos termos quadráticos da equação reduzida de um paraboloide eliptico forem iguais,
então o paraboloide eliptico pode ser visto como uma superf́ıcie de revolução em torno de seu próprio eixo, ou seja,
um paraboloide circular (ou de revolução).
Paraboloide Hiperbólico
Exemplo 5.8 A superf́ıcie de equação quadrática
x−x0
a
= (y−y0)
2
b2
− (z−z0)
2
c2
ou x−x0
a
= − (y−y0)
2
b2
+ (z−z0)
2
c2
,
sendo x0, y0, z0, a, b, c números reais fixos com a 6= 0 e b, c > 0, é chamada de paraboloide hiperbólico (primeira
figura abaixo).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 232 de 277 páginas UFU GAAL
O ponto V (x0, y0, z0) é chamado de vértice ou ponto de sela do paraboloide hiperbólico.
A reta paralela ao eixo coordenado Ox que passa pelo vértice V (x0, y0, z0) é chamada de eixo do paraboloide
hiperbólico.
x−x0
a
= − (y−y0)
2
b2
+ (z−z0)
2
c2
y−y0
b
= − (x−x0)
2
a2
+ (z−z0)
2
c2
z−z0
c
= − (x−x0)
2
a2
+ (y−y0)
2
b2
Se considerarmos a equação
y−y0
b
= (x−x0)
2
a2
− (z−z0)
2
c2
ou y−y0
b
= − (x−x0)
2
a2
+ (z−z0)
2
c2
,
sendo x0, y0, z0, a, b, c números reais fixos com b 6= 0 e a, c > 0, temos um parabolóide hiperbólico de vértice
V (x0, y0, z0) e de eixo paralelo ao eixo coordenado Oy (segunda figura acima).
Se considerarmos a equação
z−z0
c
= (x−x0)
2
a2
− (y−y0)
2
b2
ou z−z0
c
= − (x−x0)
2
a2
+ (y−y0)
2
b2
,
sendo x0, y0, z0, a, b, c númerosreais fixos com c 6= 0 e a, b > 0, temos um paraboloide hiperbólico de vértice
V (x0, y0, z0) e de eixo paralelo ao eixo coordenado Oz (terceira figura acima).
As equações consideradas acima recebem o nome de equações cartesianas reduzidas dos paraboloides hi-
perbólicos.
Casos particulares muito importantes de paraboloides hiperbólicos ocorrem quando os eixos coincidem com os eixos
coordenados e o vértice está na origem, ou seja, V (x0, y0, z0) = (0, 0, 0) e as equações se reduzem a
x
a
= y
2
b2
− z
2
c2
ou x
a
= −y
2
b2
+ z
2
c2
y
b
= x
2
a2
− z
2
c2
ou y
b
= − x
2
a2
+ z
2
c2
z
c
= x
2
a2
− y
2
b2
ou z
c
= − x
2
a2
+ y
2
b2
Na figura abaixo temos paraboloides hiperbólicos com eixos Oz e vértices na origem.
z
y
x
V
paraboloides hiperbólicos com vértices na origem e eixos Oz
Observações:
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 233 de 277 páginas
• (1) Em cursos de Cálculo Diferencial e Integral, o vértice de um paraboloide hiperbólico é chamado de ponto de sela,
devido ao fato de a superf́ıcie que o representa no sistema de coordenadas cartesianas ortogonais ser parecida com a
sela de um cavalo.
• (2) A intersecção de um paraboloide hiperbólico com planos paralelos ao seu eixo, e a um plano coordenado, são
parábolas (dáı o nome paraboloide). A interseção de um paraboloide hiperbólico com planos ortogonais ao seu eixo e
que não passam pelo vértice são hipérboles (dáı o adjetivo hiperbólico que acompanha o nome paraboloide).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
GAAL UFU Página 245 de 277 páginas
Caṕıtulo 6
Sistemas Lineares, Matrizes e
Determinantes
Este caṕıtulo aborda três assuntos básicos: sistemas lineares, matrizes e determinanes, que são pré-requisitos para
os demais caṕıtulos deste texto.
Um primeiro estudo de Álgebra Linear é focado nas chamadas transformações lineares, que serão introduzidas no
Caṕıtulo ??, página ??, e, conforme veremos, estarão intrinsicamente relacionadas com as matrizes, dáı a importância
de um estudo prévio desse assunto. Quanto aos sistemas lineares, eles são extremamente necessários ao desenvolvimento
de nossos estudos e surgem a todo momento, e em todos os caṕıtulos, deste texto. Já os determinantes são especialmente
importantes para a diagonalização de operadores lineares, conforme veremos no Caṕıtulo ??, página ??, uma vez que
está relacionado com um importante polinômio, chamado de polinômio caracteŕıstico.
6.1 Sistemas de Equações Lineares
Sejam R: conjunto dos números reais e;
C: conjunto dos números complexos.
Estes conjuntos munidos das operações de adição e multiplicação usuais são chamados de corpos numéricos.
Sejam a1, . . . , an, b ∈ R (ou C), sendo n ≥ 1. Chama-se equação linear sobre R (ou C) uma equação da
forma:
a1x1 + · · ·+ anxn = b
sendo que:
xk, 1 6 k 6 n, são as variáveis ou as incógnitas em R (ou C).
ak, 1 6 k 6 n, são os coeficientes de xk.
b é o termo independente.
Dizemos que a n-upla (α1, . . . , αn), ou x1 = α1, . . . , xn = αn, αk ∈ R (ou C) é solução da equação linear
acima quando a1α1 + · · ·+ anαn = b for verdadeira.
Observação: xk ser variável em uma equação linear significa que xk pode assumir infinitos valores, enquanto que xk
ser incógnita significa que xk pode assumir apenas um valor.
Exemplo 6.1 As equações 2x1 + 4x2 = 2 ou x2 + x3 + x4 = 0 são equações lineares sobre R.
Um sistema de equações lineares S, m por n sobre R (ou C) é um conjunto de m equações lineares sobre R
(ou C), cada uma com n variáveis ou incógnitas. Representamos S do seguinte modo:
S =

a11x1 + a12x2 + · · · + a1nxn = b1
a21x1 + a22x2 + · · · + a2nxn = b2
...
am1x1 + am2x2 + · · · + amnxn = bm (m×n)
Quando m = n dizemos que S é de ordem n. Dizemos ainda que a n-upla (α1, . . . , αn) é solução de S quando
for solução de cada uma das m equações lineares de S.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 246 de 277 páginas UFU GAAL
Quando todos os termos independentes são nulos, ou seja, bi = 0, para todo i = 1, . . . ,m, dizemos S é ho-
mogêneo.
Geralmente, um sistema de equações lineares é, simplesmente, chamado de sistema linear.
Observação: salvo menção contrária, trabalharemos apenas com S sobre R.
Exemplo 6.2 O sistema
S =
{
2x1 + 4x2 = 2
x2 + x3 + x4 = 0
é um sistema linear 2× 4 sobre R.
Dado um sistema linear S, dizemos que:
S é incompat́ıvel (ou imposśıvel) quando não admitir soluções. (SI)
S é compat́ıvel determinado (ou posśıvel e determinado) quando admitir apenas uma solução. (SPD)
S é compat́ıvel indeterminado (ou posśıvel e indeterminado) quando admitir infinitas soluções. (SPI)
Exemplo 6.3 Os sistemas
S =
{
x1 + x2 = 1
x1 + x2 = 2
e S =
{
0x1 + 0x2 = 3
4x1 + 2x2 = 0
são sistemas lineares imposśıveis.
Exemplo 6.4 O sistema
S =
 1x1 + 0x2 + 0x3 = 10x1 + 2x2 + 0x3 = 2
0x1 + 0x2 + 3x3 = 3
é um sistema linear posśıvel e determinado. Solução: x1 = x2 = x3 = 1 (ou (1, 1, 1)).
Exemplo 6.5 O sistema
S =
{
x1 + x2 = 1
2x1 + 2x2 = 2
é um sistema linear posśıvel e indeterminado.
Seja S um sistema linear. São chamadas operações elementares em S as seguintes operações:
(i) permuta de duas linhas de S.
(ii) multiplicação de uma linha de S por um número real não nulo.
(iii) soma de uma linha de S com outra linha que foi multiplicada por um número real não nulo.
Observemos que operações elementares não alteram a(s) solução(ões) do sistema linear.
Um sistema linear S1 é equivalente a um sistema linear S2 quando S2 é obtido de S1 por operações elementares.
Notação: S1 ∼ S2.
Exemplo 6.6 Os sistemas
S1 =

x1 + 2x2 + 3x3 + 4x4 = 1
2x1 + 3x2 + 4x3 + 5x4 = 2
3x1 + 4x2 + 5x3 + 6x4 = 3 .(-1)
4x1 + 5x2 + 6x3 + 7x4 = 4
�
+
e S2 =

2x1 + 3x2 + 4x3 + 5x4 = 2
x1 + 2x2 + 3x3 + 4x4 = 1
6x1 + 8x2 + 10x3 + 12x4 = 6
x1 + x2 + x3 + x4 = 1
são sistemas lineares equivalentes.
Observações.
(i) A equivalência ∼ definida acima é chamada de relaçáo de equivalência entre sistemas lineares, ou seja:
(a) S1 ∼ S1 (reflexiva);
(b) S1 ∼ S2 ⇐⇒ S2 ∼ S1 (simétrica);
(c) S1 ∼ S2 e S2 ∼ S3 =⇒ S1 ∼ S3 (transitiva).
(ii) Sistemas lineares equivalentes possuem a(s) mesma(s) solução(ões).
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 247 de 277 páginas
Dizemos que um sistema linear m× n está escalonado quando possui o seguinte formato:
a1r1xr1 + · · · + a1nxn = b1
a2r2xr2 + · · · + a2nxn = b2
...
ajrjxrj + · · · + ajnxn = bj
0xn = bj+1
...
0xn = bm
(as linhas nulas podem ser eliminadas)
sendo a1r1 , . . . , ajrj 6= 0; 1 6 r1 < r2 < · · · < rj 6 n.
Exemplo 6.7 O sistema abaixo está escalonado e é um sistema posśıvel e indeterminado (SPI):
x1 + 2x2 + 4x4 + 5x5 = 1
4x3 + 5x4 = 2
6x4 + 7x5 = 3
8x5 = 4
Exemplo 6.8 O sistema abaixo está escalonado e é um sistema imposśıvel (SI):
x1 + x2 = 1
2x2 = 3
0x2 = 5
Exemplo 6.9 O sistema abaixo está escalonado e é um sistema posśıvel e determinado (SPD):
x1 + x2 = 1
2x2 + 3x3 = 2
6x3 = 3
Proposição 6.1 Todo sistema linear é equivalente a um sistema linear escalonado.
Classificação de Sistemas Lineares Via Escalonamento
Seja S um sistema linear escalonado m× n com linhas nulas e repetidas eliminadas.
(i) Se a última linha de S for da forma 0xn = b 6= 0, então o sistema é imposśıvel (SI).
Caso as linhas da forma 0xn = b 6= 0 não ocorram temos:
(ii) Se m = n, então o sistema é posśıvel e determinado (SPD).
(iii) Se m < n, então o sistema é posśıvel e indeterminado (SPI).
Observação: se m > n, então necessariamente ocorrem linhas do tipo 0xn = b 6= 0.
Nos exemplos abaixo faremos x1 = x, x2 = y e x3 = z parasimplificar a notação.
Exemplo 6.10 Escalone e classifique o sistema
S1 =
 x + 2y − 3z = −13x − y + 2z = 7
5x + 3y − 4z = 2
.
Temos
S1 =
 x + 2y − 3z = −1 .(-3) .(-5)3x − y + 2z = 7 �+
5x + 3y − 4z = 2
�
+
∼ S2 =
 x + 2y − 3z = −1− 7y + 11z = 10 .(-1)
− 7y + 11z = 7
�
+
∼ S3 =
 x + 2y − 3z = −1− 7y + 11z = 10
0z = −3
Como a última linha do sistema escalonado S3 é da forma 0z = −3 6= 0, temos que S1 é um sistema imposśıvel.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 248 de 277 páginas UFU GAAL
Exemplo 6.11 Escalone e classifique o sistema
S1 =
 x + y + z = 6x − y + 2z = 5
x + 6y + 3z = 22
.
Temos
S1 =
 x + y + z = 6 .(-1) .(-1)x − y + 2z = 5 �+
x + 6y + 3z = 22
�
+
∼ S2 =
 x + y + z = 6− 2y + z = −1 .(5/2)
+ 5y + 2z = 16
�
+
∼ S3 =

x + y + z = 6
− 2y + z = −1
+ 9
2
z = 27
2
Como a última linha do sistema escalonado S3 não é da forma 0z = b 6= 0 e m = n = 3, temos que S1 é um sistema
posśıvel e determinado, sendo (x, y, z) = (1, 2, 3) sua solução.
Exemplo 6.12 Escalone e classifique o sistema
S1 =
 x + y + z = 2x − y + z = −2
+ 2y = 4
.
Temos
S1 =
 x + y + z = 2 .(-1)x − y + z = −2 �+
+ 2y = 4
∼ S2 =
 x + y + z = 2− 2y = −4 .(1)
+ 2y = 4
�
+
∼ S3 =
 x + y + z = 2− 2y = −4
0y = 0
∼
S4 =
{
x + y + z = 2
− 2y = −4
Como a última linha do sistema escalonado S3 não é da forma 0z = b 6= 0 e m = 2 < n = 3, temos que S1 é um
sistema posśıvel e indeterminado, sendo {(a, 2,−a) : a ∈ R} o conjunto solução.
Exerćıcio Resolvido. Uma companhia produz 3 tipos de produtos: A, B e C. Esta companhia possui 3 fábricas:
F1, F2 e F3 sendo que as fábricas produzem diariamente as seguintes quantidades:
• F1 produz 1 tonelada de cada produto;
• F2 não produz A, produz 1 tonelada de B e 2 toneladas de C;
• F3 produz 2 toneladas de A, 1 tonelada de B e 2 toneladas de C.
A companhia recebeu um pedido de 20 toneladas de A, 22 toneladas de B e 26 toneladas de C.
Quantos dias inteiros cada uma das fábricas terá de trabalhar para que juntas produzam exatamente a quantia
solicitada?
Resolução.
Sejam:
• x a quantidade de dias que F1 trabalhará.
• y a quantidade de dias que F2 trabalhará.
• z a quantidade de dias que F3 trabalhará.
Quantidade total de produto A produzido em F1: 1x.
Quantidade total de produto A produzido em F2: 0y.
Quantidade total de produto A produzido em F3: 2z.
Queremos 1x+ 0y+ 2z = 20.
Quantidade total de produto B produzido em F1: 1x.
Quantidade total de produto B produzido em F2: 1y.
Quantidade total de produto B produzido em F3: 1z.
Queremos 1x+ 1y+ 1z = 22.
Quantidade total de produto C produzido em F1: 1x.
Quantidade total de produto C produzido em F2: 2y.
Quantidade total de produto C produzido em F3: 2z.
Queremos 1x+ 2y+ 2z = 26.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 249 de 277 páginas
Logo,
S =
 x + 2z = 20x + y + z = 22
x + 2y + 2z = 26
⇒ S′ =
 x + 2z = 20y − z = 2
2y = 6
⇒ S′′ =
 x + 2z = 20y − z = 2
2z = 2
⇒ z = 1, y = 3 e x = 18.
Conclusão: F1 trabalhará 18 dias, F2 trabalhará 3 dias e F3 trabalhará 1 dia.
6.2 Matrizes
As matrizes constituem o objeto matemático primordial da Álgebra Linear, pois elas estão associadas, como veremos
nos próximos caṕıtulos, às chamadas transformações lineares entre espaços vetoriais de dimensão finita, cujo estudo
básico detalhado é nosso principal objetivo neste texto.
Vamos às definições:
Sejam m,n ∈ N. Chamamos de matriz real com m linhas e n colunas uma tabela retangular da forma
A =

a11 a12 · · · a1n
a21 a22 · · · a2n
...
...
am1 am2 · · · amn

sendo que aij ∈ R; i = 1, . . . ,m e j = 1, . . . , n; são chamados de entradas da matriz real A.
Notação: A = [aij]16i6m
16j6n
ou, simplificadamente, A = [aij].
As m linhas e as n colunas de A serão indicadas por m × n e dizemos que A é uma matriz real de tamanho
m×n ou, simplesmente, que A é uma matriz real m×n. Quando uma matriz real A possui apenas uma única linha
(1× n), chamamos A de matriz linha e, quando A possui apenas uma coluna (m× 1), chamamos A de matriz
coluna.
Ao conjunto de todas as matrizes reais m× n denotamos Mm×n (R).
Quando m = n, chamamos A de matriz real quadrada de ordem n ou, simplesmente, de matriz real de ordem
n, e denotamos o conjunto de todas as matrizes reais de ordem n por Mn (R).
Em uma matriz real A de ordem n as entradas aii ∈ R constituem a diagonal principal de A, enquanto que
as entradas aij; com i+ j = n+ 1; constituem a diagonal secundária de A.
As definições acima podem ser facilmente estendidas para as chamadas matrizes complexas, bastando, para
tanto, permitir que as entradas aij possam pertencer ao conjunto C dos números complexos. Neste caso, temos a
notação Mm×n (C), ou Mn (C), para o conjunto de tais matrizes. Em particular, uma matriz real pode ser vista como
matriz complexa, uma vez que R ⊂ C. Quanto estiver claro sobre qual conjunto numérico estamos trabalhando, é
usual dizer apenas matriz A no lugar de matriz real A ou matriz complexa A.
Há dois casos particulares de matrizes que aparecem com muita frequência nos estudos: a matriz nula e a matriz
identidade, cujas definições seguem abaixo.
Consideremos Mm×n (R) o conjunto das matrizes com m linhas e n colunas. Definimos a matriz
O =

0 0 · · · 0
0 0 · · · 0
...
...
0 0 · · · 0

m×n
como sendo a matriz nula de Mm×n (R), ou seja, O possui apenas entradas nulas.
Em particular, quando m = n dizemos que O é a matriz nula de ordem n de Mn (R).
Consideremos Mn (R) o conjunto das matrizes quadradas de ordem n. Definimos a matriz
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 250 de 277 páginas UFU GAAL
Idn =

1 0 · · · 0
0 1 · · · 0
...
...
0 0 · · · 1

n×n
como sendo a matriz identidade de ordem n de Mn (R), ou seja, a diagonal principal de Idn é constitúıda por
entradas iguais a 1, enquanto que as demais entradas são todas nulas.
Exemplo 6.13 Considere as matrizes abaixo:
A =
ï
1 −2 3
−3 0 3
ò
, B =

i −i 10 3
0 6i 1 1
−3 6 −2 −1
0 1 1+ 5i 4
 , C =

1 2 1 1
1 2 0 0
−3 8 5 2
9 −1 1 7
 , D =
1 0 00 1 0
0 0 1
 ,
E =
0 00 0
0 0
 , F = [1 3 7 9 11 13] , G =
01
0
 , H =
0 0 10 1 0
1 0 0
 , I = ïi 0 1+ i
i 1 1− i
ò
, J =
[
5
]
.
• A é uma matriz real 2× 3 com entradas a11 = 1, a12 = −2, a13 = 3, a21 = −3, a22 = 0 e a23 = 3.
• B é uma matriz complexa (quadrada) de ordem 4, com destaque para as entradas b11 = i (i é a unidade imaginária
dos números complexos: i =
√
−1), b22 = 6i, b33 = −2 e b44 = 4, que constituem a diagonal principal de B;
• C é uma matriz real de ordem 4, com destaque para as entradas c14 = 1, c23 = 0, c32 = 8, e c41 = 9, que constituem
a diagonal secundária de C (observe que, neste caso, os cij da diagonal secundária são tais que i+ j = 5);
• D é a matriz identidade de ordem 3;
• E é a matriz nula 3× 2;
• F é uma matriz real linha 1× 6;
• G é uma matriz real coluna 3× 1;
• H é uma matriz real de ordem 3 (cuidado: não é a matriz identidade de ordem 3);
• I é uma matriz complexa 2× 3.
• J é uma matriz real de ordem 1.
É posśıvel definir operações sobre Mm×n (R) que serão extremamente úteis para o desenvolvimento das trans-
formações lineares que serão objetos de estudos futuros.
Operações com matrizes:
• (i) Adição de matrizes: Sejam A = [aij], B = [bij] ∈Mm×n (R). Chama-se soma de A com B, e indica-se por
A+ B, a matriz C = [cij] ∈Mm×n (R) tal que cij = aij + bij.
Simbolicamente:
+ : Mm×n (R)×Mm×n (R) −→ Mm×n (R)
(A,B) 7−→ A+ B
• (ii) Multiplicação de matriz por escalar: Sejam A = [aij] ∈ Mm×n (R) e α ∈ R. Chama-se produto de α
por A a matriz real m× n dada por αA = [αaij].
• (iii) Multiplicação de matrizes: Sejam A = [aik] ∈Mm×p (R) e B = [bkj] ∈Mp×n (R).Chama-se produto de
A por B, e indica-se por AB, a matriz C = [cij] ∈Mm×n (R) tal que cij =
p∑
k=1
aikbkj.
Exemplo 6.14 Adição:
1 23 4
5 6

3×2
+
6 54 3
2 1

3×2
=
7 77 7
7 7

3×2
.
Exemplo 6.15 Multiplicação por escalar: 2
ï
1 2
3 4
ò
2×2
=
ï
2 4
6 8
ò
2×2
.
Exemplo 6.16 Multiplicação:
1 22 1
2 2

3×2
ï
1 2 3 4
5 6 7 8
ò
2×4
=
11 14 17 207 10 13 16
12 16 20 24

3×4
.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 251 de 277 páginas
Uma indagação muito comum na operação de multiplicação de matrizes é o por quê de uma definição tão artificial.
Não seria mais fácil definir a multiplicação de modo análogo à adição, ou seja, multiplicar entradas correspondentes
nas matrizes? A justificativa para essa indagação será apresentada mais adiante. Resumidamente, o que podemos
dizer, por enquanto, é que matrizes serão associadas às chamadas transformações lineares e a composta de duas
transformações lineares corresponde à multiplicação de suas matrizes de acordo com a definição acima. Este é um dos
(poucos) casos em que o aluno de Ensino Médio é apresentado para uma definição a qual o professor não tem condições
de justificar de forma razoável, uma vez que o assunto transformações lineares não é objeto de estudos no Ensino
Médio.
Proposição 6.2 Propriedades operatórias das matrizes:
• (i) Da adição:
Sejam A,B,C ∈Mm×n (R).
(1) (A+ B) + C = A+ (B+ C); (associativa)
(2) A+ B = B+A; (comutativa)
(3) Existe O ∈Mm×n (R) tal que A+O = A; (elemento neutro aditivo)
(4) Existe −A ∈Mm×n (R) tal que A+ (−A) = O. (elemento inverso aditivo)
• (ii) Da multiplicação por escalar:
Sejam α,β ∈ R e A,B ∈Mm×n (R).
(1) α (βA) = (αβ)A; (associativa)
(2) α (A+ B) = αA+ αB; (distributiva em relação à soma de matrizes)
(3) (α+ β)A = αA+ βA; (distributiva em relação à soma de escalares)
(4) 1A = A. (elemento neutro da multiplicação por escalar)
• (iii) Da multiplicação:
(1) A (BC) = (AB)C sendo A ∈Mm×p (R), B ∈Mp×q (R) e C ∈Mq×n (R); (associativa)
(2) A (B+ C) = AB+AC; A ∈Mm×p (R), B,C ∈Mp×n (R); (distributiva à direita em relação à soma de matrizes)
(3) (A+ B)C = AC + BC; A,B ∈ Mm×p (R), C ∈ Mp×n (R); (distributiva à esquerda em relação à soma de
matrizes)
(4) (αA) (βB) = (αβ)AB; α,β ∈ R, A ∈Mm×p (R) e B ∈Mp×n (R).
Observação: a propriedade comutativa não é válida para a multiplicação de matrizes. Um contra-exemplo:ï
1 2
3 4
ò ï
1 1
1 1
ò
=
ï
3 3
7 7
òï
1 1
1 1
ò ï
1 2
3 4
ò
=
ï
4 6
4 6
ò
Transposta de uma Matriz
A transposta de uma matriz A, denotada por At, é a matriz obtida de A escrevendo as linhas de A como
colunas de At, ou seja, quando A = [aij] ∈Mm×n (R), temos At = [bji] ∈Mn×m (R) tal que aij = bji.
Mais explicitamente:
A =

a11 a12 · · · a1n
a21 a22 · · · a2n
...
...
am1 am2 · · · amn

m×n
⇒ At =

a11 a21 · · · am1
a12 a22 · · · am2
...
...
a1n a2n · · · amn

n×m
Exemplo 6.17 Se A =
1 23 4
5 6

3×2
, então At =
ï
1 3 5
2 4 6
ò
2×3
.
Proposição 6.3 Propriedades das matrizes transpostas:
(1) (A+ B)
t
= At + Bt, sendo A,B ∈Mm×n (R).
(2) (kA)
t
= kAt, sendo A ∈Mm×n (R) e k ∈ R.
(3) (At)
t
= A, sendo A ∈Mm×n (R).
(4) (AB)
t
= BtAt, sendo A ∈Mm×p (R) e B ∈Mp×n (R).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 252 de 277 páginas UFU GAAL
Matrizes Invert́ıveis
O conceito de matriz invert́ıvel requer que trabalhemos exclusivamente com matrizes quadradas. Portanto, consi-
deremos Mn (R).
Definimos a matriz identidade Idn, de ordem n, acima e é muito fácil verificar a validade da seguinte propriedade:
IdnA = A Idn = A para qualquer A ∈Mn (R), o que significa que Idn é o elemento neutro multiplicativo das matrizes
quadradas. Este fato motiva a seguinte definição:
Dizemos que A ∈Mn (R) é invert́ıvel quando existe B ∈Mn (R) tal que AB = BA = Idn.
Notação: B = A−1; (B é a matriz inversa de A).
Observemos que, de certa forma, o conceito de matriz inversa é parecido com o conceito de inverso multiplicativo
de número real.
Abaixo seguem algumas propriedades:
Proposição 6.4 Propriedades das matrizes inversas. Sejam A,B ∈Mn (R).
(1) Se A apresentar uma linha ou coluna nula, então A não é invert́ıvel.
(2) Se A for invert́ıvel, então
(
A−1
)−1
= A; (a inversa da inversa é a própria matriz).
(3) Se A e B forem invert́ıveis, então AB também é invert́ıvel e (AB)−1 = B−1A−1. (cuidado com a ordem dos fatores
neste produto!)
Determinação da Inversa de uma Matriz
De modo análogo a sistemas lineares, dizemos que A,B ∈Mn (R) são equivalentes quando B puder ser obtida
de A via um número finito de operações elementares sobre as linhas de A.
Abaixo segue um resultado matemático (proposição ou teorema) que é muito útil para o cálculo de matrizes
inversas.
Proposição 6.5 Seja A ∈Mn (R). Temos:
A é invert́ıvel ⇐⇒ A é equivalente à Idn
e, neste caso, as mesmas operações elementares que transformam A em Idn, transformam Idn em A
−1.
Observação: o śımbolo ⇐⇒ na proposição acima significa equivalência e pode ser lido como “se, e somente se”.
Quando escrevemos P ⇐⇒ Q significa que se P for considerado hipótese, então Q é tese (P ⇒ Q) e vice-versa, ou seja,
se Q for considerado hipótese, então P é tese (Q⇒ P).
Como consequência (corolário) do resultado matemático acima temos:
Corolário 6.1 Sejam A,B ∈Mn (R) matrizes quadradas equivalentes. A matriz A é invert́ıvel se, e somente se, a matriz
B é invert́ıvel.
Exemplo 6.18 Verifiquemos se A =
1 0 11 1 0
0 2 1
 é invert́ıvel e obtenhamos a inversa, caso afirmativo.
Montemos um arranjo com a matriz A e Id3 lado a lado para aplicarmos as operações elementares simultaneamente
nas duas matrizes.
A | Id3 =⇒
1 0 11 1 0
0 2 1
1 0 00 1 0
0 0 1
 .(-1)�+ =⇒
1 0 10 1 −1
0 2 1
 1 0 0−1 1 0
0 0 1
 .(-2)�
+
=⇒
1 0 10 1 −1
0 0 3
 1 0 0−1 1 0
2 −2 1

.(1/3)
=⇒
1 0 10 1 −1
0 0 1
 1 0 0−1 1 0
2/3 −2/3 1/3
 �+
.(1)
�+
.(-1)
=⇒
1 0 00 1 0
0 0 1
 1/3 2/3 −1/3−1/3 1/3 1/3
2/3 −2/3 1/3
 =⇒ Id3 | A−1
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 253 de 277 páginas
Logo, A é invert́ıvel e A−1 = 1
3
 1 2 −1−1 1 1
2 −2 1
.
Exemplo 6.19 Verifiquemos se A =
3 −1 02 1 −1
1 0 2
 é invert́ıvel e obtenhamos a inversa, caso afirmativo.
Montemos um arranjo com a matriz A e Id3 lado a lado para aplicarmos as operações elementares simultaneamente
nas duas matrizes.
A | Id3 =⇒
3 −1 02 1 −1
1 0 2
1 0 00 1 0
0 0 1
 �
� =⇒
1 0 22 1 −1
3 −1 0
0 0 10 1 0
1 0 0
 .(-2)�+ .(-3)�
+
=⇒
1 0 20 1 −5
0 −1 −6
0 0 10 1 −2
1 0 −3
 .(1)�
+
=⇒
1 0 20 1 −5
0 0 −11
0 0 10 1 −2
1 1 −5

.(-1/11)
=⇒
1 0 20 1 −5
0 0 1
 0 0 10 1 −2
−1/11 −1/11 5/11
 �+
.(5)
�+
.(-2)
=⇒
1 0 00 1 0
0 0 1
 2/11 2/11 1/11−5/11 6/11 3/11
−1/11 −1/11 5/11
 =⇒ Id3 | A−1
Logo, A é invert́ıvel e A−1 = 1
11
 2 2 1−5 6 3
−1 −1 5
.
Observações importantes:
(i) Quando tentamos inverter uma matriz A quadrada que não possui inversa pelo método acima, simplesmente é
imposśıvel obter Idn a partir de A por meio de operações elementares sobre linhas de A. Isso fica evidente durante o
processo, pois fatalmente aparecerá uma linha ou coluna nula durante as operações sobre A, indicando a inexistência
da inversa A por proposição já apresentada e o corolário acima.
(ii) O procedimento de obtenção da inversa de uma matriz delineado acima, por meio de operações elementares sobre
as linhas da matriz, não pode ser usado com operações elementares sobre as colunas da matriz e, muito menos, com
a mistura das operações elementares sobre linhas e sobre colunas.
Matrizes e Sistemas Lineares
Consideremos o sistema linear
S =

a11x1 + a12x2+ · · · + a1nxn = b1
a21x1 + a22x2 + · · · + a2nxn = b2
...
am1x1 + am2x2 + · · · + amnxn = bm (m×n)
Podemos colocar S na notação matricial adotando as seguintes matrizes:
A =

a11 a12 · · · a1n
a21 a22 · · · a2n
...
...
am1 am2 · · · amn

m×n
matriz dos coeficientes de S
X =

x1
x2
...
xn

n×1
matriz das variáveis ou incógnitas de S e B =

b1
b2
...
bm

m×1
matriz dos termos independentes de S
Logo, Am×nXn×1 = Bm×1 (ou, resumidamente, AX = B) é uma equação matricial que representa o sistema linear
original S.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 254 de 277 páginas UFU GAAL
Exemplo 6.20 O sistema S =
 3x − y = 12x + y − z = 0
x + 2z = 2
possui representação matricial AX = B tal que
3 −1 02 1 −1
1 0 2

3×3︸ ︷︷ ︸
A
xy
z

3×1︸ ︷︷ ︸
X
=
10
2

3×1︸ ︷︷ ︸
B
Sistemas de Cramer
Dizemos que um sistema linear S de ordem n é um Sistema de Cramer quando a matriz A dos coeficientes
de S é invert́ıvel.
Observações:
(1) Em um Sistema de Cramer, AX = B ⇒ A−1AX = A−1B ⇒ InX = A−1B ⇒ X = A−1B, o que significa que todo
Sistema de Cramer é posśıvel e determinado.
(2) Se um sistema linear é homogêneo (ou seja, a matriz B dos termos independentes é uma matriz coluna nula) e é
um Sistema de Cramer, então a solução do sistema é a solução trivial (isto é, solução nula). De fato, AX = 0⇒ X =
A−10⇒ X = 0. (0 é matriz coluna nula).
Exemplo 6.21 Resolvamos o Sistema de Cramer S =
 3x − y = 12x + y − z = 0
x + 2z = 2
invertendo a matriz de coeficientes.
Representando S temos
AX = B, sendo A =
3 −1 02 1 −1
1 0 2
 , B =
10
2
 e X =
xy
z
 .
Mas vimos em exemplo anterior que A−1 = 1
11
 2 2 1−5 6 3
−1 −1 5
. Logo, AX = B⇒ X = A−1B, ou seja,
xy
z
 = 1
11
 2 2 1−5 6 3
−1 −1 5
10
2
 =
4/111/11
9/11
⇒ x = 4
11
, y = 1
11
e z = 9
11
.
Portanto,
(
4
11
, 1
11
, 9
11
)
é a solução procurada.
Observação: Embora a técnica acima seja interessante, normalmente é bem mais simples resolver um sistema linear
por escalonamento do que invertendo matriz de coeficientes.
6.2.1 Alguns Tipos Especiais de Matrizes
Nesta subseção apresentamos alguns tipos especiais de matrizes que surgem com frequência nos demais caṕıtulos
deste texto. Quase todas essas matrizes podem ser associadas àquilo que definiremos adiante como operadores lineares,
que são casos particulares das chamadas transformações lineares. Grosso modo, as transformações lineares estão para
a Álgebra Linear assim como as funções reais de uma variável real estão para o Cálculo Diferencial e Integral 1.
Matrizes Ortogonais
Matrizes ortogonais estão relacionadas com alguns tipos especiais de aplicações que estudamos adiante. São as
chamadas isometrias, que são aplicações que preservam distâncias, áreas e ângulos. O estudo das isometrias constituem
um dos mais importantes ramos da Matemática e há inúmeras aplicações práticas envolvendo-as.
Seja A ∈Mn (R) invert́ıvel. Dizemos que A é matriz ortogonal quando sua inversa for igual a sua transposta,
ou seja, A−1 = At. Desta forma, quando A é matriz ortogonal, temos
AAt = AtA = Idn .
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 255 de 277 páginas
Exemplo 6.22 A =
ñ
1/2
√
3/2√
3/2 −1/2
ô
é matriz ortogonal pois At =
ñ
1/2
√
3/2√
3/2 −1/2
ô
e AAt = AtA = Id2.
Matrizes Triangulares Superiores ou Inferiores
Matrizes triangulares superiores ou inferiores são especiais pelo fato de possuirem determinantes (próxima seção)
muito simples de serem calculados.
Seja A = [aij] ∈Mn (R).
Dizemos que A é matriz triangular superior quando aij = 0 para i > j, ou seja, todas a entradas abaixo da
diagonal principal são nulas.
Dizemos que A é matriz triangular inferior quando aij = 0 para i < j, ou seja, todas a entradas acima da
diagonal principal são nulas.
Exemplo 6.23 A =
2 0 30 2 5
0 0 6
 é matriz triangular superior e B =
2 0 03 2 0
4 5 6
 é matriz triangular inferior. Em
particular, a matriz identidade Idn, de ordem n, e a matriz nula O ∈Mn (R), de ordem n, são matrizes triangulares
superior e inferior ao mesmo tempo.
Matrizes Diagonais
Matrizes diagonais são de especial importância na Álgebra Linear pois, além de possuirem determinantes (próxima
seção) muito simples de serem calculados, tais matrizes comportam-se de modo muito parecido com os número reais.
Vimos que a operação de adição de matrizes cumpre as mesmas propriedades do corpo dos números reais (as-
sociativa, comutativa, elemento neutro e elemento oposto). Vimos, também, que o mesmo não é verdade quando
consideramos a operação de multiplicação de matrizes. Entretanto, quando nos restringimos às matrizes diagonais,
a operação de multiplicação de matrizes passa a cumprir as mesmas propriedades multiplicativas dos números reais
(neste caso o elemento neutro multiplicativo é a matriz identidade). É inegável que, por esse motivo, trabalhar com
matrizes diagonais é bem mais simples do que trabalhar com outros tipos de matrizes. Sendo assim, a busca por
matrizes diagonais que possam ser associadas a operadores lineares constituem um das mais belas partes da Álgebra
Linear. Nestas notas, esse assunto mereceu ser abordado em um caṕıtulo inteiro e exclusivo (Caṕıtulo ??, página ??),
conforme veremos adiante.
Vamos à definição:
Seja A = [aij] ∈ Mn (R). Dizemos que A é matriz diagonal quando aij = 0 para i 6= j, ou seja, todas as
entradas que não estão na diagonal principal são nulas. Em particular, quando uma matriz diagonal é da forma
A = k Idn, sendo k ∈ R, dizemos que A é uma matriz escalar.
Observemos que uma matriz diagonal é, também, matriz triangular inferior e matriz triangular superior ao mesmo
tempo.
Exemplo 6.24 A =
2 0 00 2 0
0 0 2
 e B =
0 0 00 1 0
0 0 8
 são matrizes diagonais (em particular, A é matriz escalar). A
matriz identidade Idn, de ordem n, e a matriz nula O ∈ Mn (R), de ordem n, são, também, matrizes diagonais e
escalares.
Matrizes Simétricas e Anti-Simétricas
As matrizes simétricas estão associadas a um tipo especial de operador linear: os chamados operadores auto-
adjuntos, que também são operadores de especial importância na Álgebra Linear. A definição de matriz simétrica
segue abaixo, juntamente com a definição de matriz anti-simétrica.
Seja A = [aij] ∈Mn (R). Dizemos que A é matriz simétrica quando A coincide com sua transposta, ou seja,
A = At .
Isto significa que aij = aji.
Seja A = [aij] ∈ Mn (R). Dizemos que A é matriz anti-simétrica quando A coincide com o oposto de sua
transposta, ou seja,
A = −At .
Isto significa que aij = −aji.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 256 de 277 páginas UFU GAAL
Exemplo 6.25 As matrizes A =
2 3 73 2 9
7 9 6
 e B =
0 5 05 1 6
0 6 8
 são matrizes simétricas. Em particular, a matriz
identidade Idn, de ordem n, e a matriz nula O ∈Mn (R), de ordem n, são matrizes simétricas.
As matrizes C =
 0 3 −7−3 0 −9
7 9 0
 e D =
0 −5 05 0 6
0 −6 0
 são matrizes anti-simétricas. A matriz nula O ∈Mn (R) , de
ordem n, é, também, anti-simétrica.
Matrizes Semelhantes
O conceito de matrizes semelhantes pode parecer estranho em uma primeira apresentação. Entretanto, ele é
necessário para um estudo consistente de operadores lineares. Veremos nos próximos caṕıtulos que um mesmo operador
linear pode estar associado a inúmeras matrizes distintas. Essas matrizes dependem daquilo que chamamos de base de
um espaço vetorial (apresentamos esses conceitos mais adiante) e bases não são únicas. Sendo assim, um dos problemas
que se apresenta é descobrir a relação entre matrizes diferentes associadas a um mesmo operador linear. Esta relação
passa por aquilo que chamamosde matriz de mudança de bases (próximo caṕıtulo) e chegamos ao resultado de que
matrizes associadas a um mesmo operador linear são semelhantes, no sentido da definição abaixo.
Sejam A,B ∈ Mn (R). Dizemos que A e B são matrizes semelhantes quando existe M ∈ Mn (R) invert́ıvel
tal que A =M−1BM.
Exemplo 6.26 As matrizes A =
−4 −8 −210 3 6
6 13 3
 e B =
1 2 00 1 1
3 2 0
 são matrizes semelhantes.
De fato, M =
0 1 05 1 3
3 1 2
 possui inversa, que é M−1 =
 1 2 −31 0 0
−2 −3 5
 e
−4 −8 −210 3 6
6 13 3
 =
 1 2 −31 0 0
−2 −3 5
 .
1 2 00 1 1
3 2 0
 .
0 1 05 1 3
3 1 2
 ,
ou seja, A =M−1BM.
6.3 Determinantes de Matrizes
Toda aplicação bijetiva σ : {1, 2, . . . , n}→ {1, 2, . . . , n} é chamada de permutação do conjunto {1, 2, . . . , n}.
Exemplo 6.27 Existem 6 permutações do conjunto {1, 2, 3}. Chamemo-as de σ1, σ2, . . . , σ6. São elas: σ1 (1) = 1σ1 (2) = 2
σ1 (3) = 3
,
 σ2 (1) = 1σ2 (2) = 3
σ2 (3) = 2
,
 σ3 (1) = 3σ3 (2) = 1
σ3 (3) = 2
,
 σ4 (1) = 3σ4 (2) = 2
σ4 (3) = 1
,
 σ5 (1) = 2σ5 (2) = 3
σ5 (3) = 1
e
 σ6 (1) = 2σ6 (2) = 1
σ6 (3) = 3
Vamos adotar a seguinte notação para uma permutação σ : {1, 2, . . . , n}→ {1, 2, . . . , n}
σ :
Å
1 2 3 · · · n
σ (1) σ (2) σ (3) · · · σ (n)
ã
Assim, no exemplo acima as 6 permutações são denotadas do seguinte modo:
σ1 :
Å
1 2 3
1 2 3
ã
; σ2 :
Å
1 2 3
1 3 2
ã
; σ3 :
Å
1 2 3
3 1 2
ã
; σ4 :
Å
1 2 3
3 2 1
ã
; σ5 :
Å
1 2 3
2 3 1
ã
e σ6 :
Å
1 2 3
2 1 3
ã
É fácil notar que o número de permutações de um conjunto com n elementos é n!
No exemplo acima, n = 3 e temos 3! = 6 permutações.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 257 de 277 páginas
Seja σ uma permutação de {1, 2, . . . , n} e r a quantidade de vezes que ocorre um decrescimento na imagem de
σ, ou seja,
i < j⇒ σ (i) > σ (j)
sendo i, j ∈ {1, 2, . . . , n}.
Definimos a função sinal de σ, denotada por sgn (σ), do seguinte modo:{
sgn (σ) = 1, quando r é par.
sgn (σ) = −1, quando r é ı́mpar.
Exemplo 6.28 Consideremos as permutações do exemplo anterior.
Para σ1 temos r = 0. Logo, sgn (σ1) = 1.
Para σ2 temos r = 1. Logo, sgn (σ2) = −1.
Para σ3 temos r = 2. Logo, sgn (σ3) = 1.
Para σ4 temos r = 3. Logo, sgn (σ4) = −1.
Para σ5 temos r = 2. Logo, sgn (σ5) = 1.
Para σ6 temos r = 1. Logo, sgn (σ6) = −1.
Seja A = [aij] ∈Mn (R) uma matriz real de ordem n. Ao número∑
σ
sgn (σ)a1σ(1)a2σ(2) · · ·anσ(n)
chamamos de determinante de A e indicamos por detA.
O somatório acima é sobre todas as n! permutações σ do conjunto {1, 2, . . . , n}. Portanto, a soma acima é
constitúıda por n! parcelas.
Exemplo 6.29 Se n = 1, então A = [a11] e existe apenas uma permutação σ : {1}→ {1} que é σ (1) = 1. Logo, r = 0
e sgn (σ) = 1.
Logo,
detA =
∑
σ
sgn (σ)a1σ(1) = 1a11 = a11.
Assim, por exemplo, se A = [7], então detA = 7.
Exemplo 6.30 Se n = 2, então A =
ï
a11 a12
a21 a22
ò
e existem 2! = 2 permutações σ1 :
Å
1 2
1 2
ã
e σ2 :
Å
1 2
2 1
ã
. Logo,
para σ1 temos r = 0 e sgn (σ1) = 1, enquanto que para σ2 temos r = 1 e sgn (σ2) = −1.
Logo,
detA =
∑
σ
sgn (σ)a1σ(1)a2σ(2)
= sgn (σ1)a1σ1(1)a2σ1(2) + sgn (σ2)a1σ2(1)a2σ2(2)
= 1a11a22 + (−1)a12a21
= a11a22 − a12a21.
Assim, por exemplo, se A =
ï
1 2
3 4
ò
, então detA = 4− 6 = −2.
Exemplo 6.31 Se n = 3, então A =
a11 a12 a13a21 a22 a23
a31 a32 a33
 e existem 3! = 6 permutações que são as apresentadas nos
dois primeiros exemplos dessa seção.
Logo,
detA =
∑
σ
sgn (σ)a1σ(1)a2σ(2)a3σ(3)
= sgn (σ1)a1σ1(1)a2σ1(2)a3σ1(3) + · · ·+ sgn (σ6)a1σ6(1)a2σ6(2)a3σ6(3)
= 1a11a22a33 + (−1)a11a23a32 + 1a13a21a32 + (−1)a13a22a31 + 1a12a23a31 + (−1)a12a21a33
= (a11a22a33 + a12a23a31 + a13a21a32) − (a13a22a31 + a11a23a32 + a12a21a33) .
Assim, por exemplo, se A =
1 2 34 5 6
7 8 9
, então detA = 45+ 84+ 96− 105− 48− 72 = 0.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 258 de 277 páginas UFU GAAL
Exemplo 6.32 Seja A =

a11 0 0 · · · 0
a21 a22 0 · · · 0
...
...
an1 an2 an3 · · · ann
. Seja uma permutação σ de {1, 2, . . . , n} diferente da identi-
dade. Logo, existe i ∈ {1, . . . , n} tal que σ (i) = j > i e, portanto, a1σ(1) . . . aiσ(i) . . . anσ(n) = 0 pois aiσ(i) = 0.
Logo, detA =
∑
σ
sgn (σ)a1σ(1)a2σ(2) . . . anσ(n) = 1a11a22 . . . ann. (só a permutação identidade)
Proposição 6.6 Propriedades de determinantes:
• (1) Linearidade sobre colunas:
(1i) det

a11 · · · a1i + a1i′ · · · a1n
a21 · · · a2i + a2i′ · · · a2n
...
...
an1 · · · ani + ani′ · · · ann
 = det

a11 · · · a1i −0.1cm · · · a1n
a21 · · · a2i −0.1cm · · · a2n
...
...
an1 · · · ani −0.1cm · · · ann
 +
det

a11 · · · a1i′ · · · a1n
a21 · · · a2i′ · · · a2n
...
...
an1 · · · ani′ · · · ann
.
(1ii) det

a11 · · · ka1i · · · a1n
a21 · · · ka2i · · · a2n
...
...
an1 · · · kani · · · ann
 = k det

a11 · · · a1i · · · a1n
a21 · · · a2i · · · a2n
...
...
an1 · · · ani · · · ann
, sendo k ∈ R.
Propriedades análogas valem para as linhas (linearidade sobre linhas).
• (2) Uma matriz real de ordem n com duas linhas ou duas colunas iguais possui determinante zero.
• (3) Seja B uma matriz real de ordem n obtida de A pela permutação de duas linhas ou duas colunas de A. Então,
detB = −detA.
• (4) det
a11 · · · a1i · · · a1n... ...
an1 · · · ani · · · ann
 = det

a11 · · · a1i +
n∑
k=1
k6=i
αka1k · · · a1n
...
...
an1 · · · ani +
n∑
k=1
k6=i
αkank · · · ann
, sendo αk ∈ R.
A propriedade (4) acima também vale para linhas.
• (5) Se A ∈Mn (R), então detA = detAt .
• (6) Se A,B ∈Mn (R), então det (AB) = detA detB .
• (7) Se A ∈Mn (R) é invert́ıvel, então det
(
A−1
)
= 1detA .
Da propriedade (1i) resulta que se uma matriz real de ordem n possui uma linha ou uma coluna nula, então seu
determinante é zero.
A propriedade (4) permite fazer escalonamento em matrizes sem alterar o determinante (veja exemplo abaixo).
Como det (Idn) = 1, a propriedade (7) é uma consequência direta da propriedade (6).
Exemplo 6.33 det
1 2+ 3 45 6+ 0 5
4 3+ 2 1
 = det
1 2 45 6 5
4 3 1
+ det
1 3 45 0 5
4 2 1
 = −15+ 75 = 60.
Exemplo 6.34 det
1 2.2 34 2.5 6
7 2.8 0
 = 2det
1 2 34 5 6
7 8 0
 = 54.
Exemplo 6.35 det
1 1 23 3 4
5 5 6
 = 0. (duas colunas iguais)
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 259 de 277 páginas
Exemplo 6.36 det
1 2 34 5 6
7 8 0
 = −det
2 1 35 4 6
8 7 0
 = 27.
Exemplo 6.37 det
1 2 34 5 6
7 8 0
 = det
1+ 2.2+ 5.3 2 34+ 2.5+ 5.6 5 6
7+ 2.8+ 5.0 8 0
 = 27. (neste exemplo, n = 3, i = 1, α2 = 2 e α3 = 5)
Exemplo 6.38 Calculemos o determinante da matriz A =

1 5 2 1
3 4 2 0
1 2 1 2
0 3 1 3
 aplicando a propriedade (4) sucessivas
vezes, fazendo um escalonamento.
det

1 5 2 1
3 4 2 0
1 2 1 2
0 3 1 3

.(-5) �
.(-2) �
.(-1) �
= det

1 5+ (−5) 1 2+ (−2) 1 1+ (−1) 1
3 4+ (−5) 3 2+ (−2) 3 0+ (−1) 3
1 2+ (−5) 1 1+ (−2) 1 2+ (−1) 1
0 3+ (−5) 0 1+ (−2) 0 3+ (−1) 0
 = det

1 0 0 0
3 −11 −4 −3
1 −3 −1 1
0 3 1 3

.(-4/11) �
.(-3/11) �
= det

1 0 0 0
3 −11 0 0
1 −3 1/11 20/11
0 3 −1/11 24/11

.(-20) �
= det

1 0 0 0
3 −11 0 0
1 −3 1/11 0
0 3 −1/11 4
 = 1 (−11) ( 111) 4 = −4.
Regra de Laplace para Cálculo de Determinantes
A definição abaixo é fundamental para a introdução de uma das técnicas mais comuns para cálculo de determinantes,
que é a Regra de Laplace, enunciada em seguida.
Sejam
A =
a11 · · · a1n... ...
an1 · · · ann

n×n
e aij uma entrada de A. Ao número Aij = (−1)
i+j
Dij, sendo Dij o determinante da matriz (n− 1) × (n− 1)
obtida pela supressão da i-ésima linha e j-ésima coluna de A, chamamos de cofator de aij.
Dizemos ainda que Dij é o menor complementar de aij.
Proposição 6.7 (Regrade Laplace) Seja A matriz real n× n e aij uma entrada dessa matriz. Então,
detA =
n∑
i=1
aijAij︸ ︷︷ ︸↓
=
n∑
j=1
aijAij︸ ︷︷ ︸↓
soma dos produtos dos elementos soma dos produtos dos elementos
da coluna j por seus cofatores da linha i por seus cofatores
Exemplo 6.39 Calculemos o determinante de A =
1 2 34 5 6
7 8 9
 utilizando a Regra de Laplace.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 260 de 277 páginas UFU GAAL
Escolhendo a primeira linha de A temos detA =
3∑
j=1
a1jA1j. Logo,
detA = a11A11 + a12A12 + a13A13
= a11 (−1)
1+1
D11 + a12 (−1)
1+2
D12 + a13 (−1)
1+3
D13
= a11 (−1)
1+1
det
ï
5 6
8 9
ò
+ a12 (−1)
1+2
det
ï
4 6
7 9
ò
+ a13 (−1)
1+3
det
ï
4 5
7 8
ò
= 1 (1) (45− 48) + 2 (−1) (36− 42) + 3 (1) (32− 35)
= −3+ 12− 9
= 0
Regra de Chió para Cálculo de Determinantes
Esta regra é uma combinação das propriedades de determinantes e da Regra de Laplace. O método consiste em
usar as propriedades para criar uma linha ou coluna que tenha uma entrada igual a 1 e as demais entradas iguais a 0.
Depois, basta a aplicar a Regra de Laplace utilizando essa linha ou coluna. Com isso, precisamos calcular apenas um
cofator.
Seja A =
a11 · · · a1n... ...
an1 · · · ann
 ∈Mn (R) não nula. Sem perda de generalidade, suponhamos que a11 6= 0.
Da propriedade (1) (ii) podemos escrever
detA = a11 det

1 b12 · · · b1n
a21 a22 a2n
...
...
an1 an2 · · · ann

sendo b1j =
a1j
a11
.
Da propriedade (4) podemos escrever
detA = a11 det

1 b12 · · · b1n
a21 a22 a2n
...
...
an1 an2 · · · ann

.(-b12) �
...
.(-b1n) �
= a11 det

1 0 · · · 0
a21 a
′
22 a
′
2n
...
...
an1 a
′
n2 · · · a′nn

sendo a′ij = aij − ai1b1j; i = 2, . . . , n e j = 2, . . . , n.
Utilizando a Regra de Laplace:
detA = a11 det

1 0 · · · 0
a21 a
′
22 a
′
2n
...
...
an1 a
′
n2 · · · a′nn
 = a11 (1) (−1)1+1 det
a
′
22 a
′
2n
...
a′n2 · · · a′nn

detA = a11 det
a
′
22 a
′
2n
...
a′n2 · · · a′nn

Exemplo 6.40 Calculemos o determinante de A =
 2 2 4−1 5 7
1 2 1
 utilizando a Regra de Chió.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 261 de 277 páginas
Escolhendo a primeira linha e a primeira entrada:
det
 2 2 4−1 5 7
1 2 1
 = 2det
 1 1 2−1 5 7
1 2 1

.(-1) �
.(-2) �
= 2det
 1 0 0−1 6 9
1 1 −1
 = 2det ï6 9
1 −1
ò
= 2 (−6− 9) = −30
Regra de Sarrus para Cálculo de Determinantes de Matrizes de Ordem 3
Este método só vale para matrizes de ordem 3.
Já vimos que se A =
a11 a12 a13a21 a22 a23
a31 a32 a33
, então
detA = (a11a22a33 + a12a23a31 + a13a21a32) − (a13a22a31 + a11a23a32 + a12a21a33) .
O método de Sarrus consiste apenas em enxergar um dispositivo prático com a tabela de entradas da matriz A
que nos conduza ao resultado acima.
Para simplificar, reescrevamos a matriz A do seguinte modo: A =
a b cd e f
g h i
. Logo,
detA = aei+ bfg+ chd− ceg− bdi− ahf.
Observe na figura abaixo o procedimento prático da Regra de Sarrus:
g h i g h
d e f d e
a b c a b
-ceg- - + + +afh bdi aei bfg cdh
Note que os produtos advindos das setas paralelas à diagonal principal permanecem inalterados, enquanto que
os produtos advindos das setas paralelas à diagonal secundária são multiplicados por −1 (ou seja, seus “sinais” são
trocados). No final, todos os seis termos são somados para obtermos o determinante.
Exemplo 6.41 Calculemos o determinante de A =
1 2 33 2 1
1 1 1
 utilizando a Regra de Sarrus.
Temos, de acordo com o dispositivo prático:
1 1 1 1 1
3 2 1 3 2
1 2 3 1 2
-6 - - + + +1 6 2 2 9
Logo, detA = 2+ 2+ 9− 6− 1− 6 = 0.
Matriz Adjunta
Nesta subseção apresentamos um novo método para calcular a matriz inversa de uma matriz invert́ıvel.
Seja A = [aij] matriz real de ordem n e sejam Aij os cofatores de aij. Definimos a matriz adjunta de A como
sendo
AdjA = [Aij]
t
=

A11 A21 · · · An1
A12 A22 · · · An2
...
...
A1n A2n · · · Ann

n×n
A importância da matriz adjunta reside no resultado abaixo.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 262 de 277 páginas UFU GAAL
Proposição 6.8 Seja A matriz real n× n tal que detA 6= 0. Então, A é invert́ıvel e
A−1 = 1detA AdjA .
Exemplo 6.42 Calculemos a matriz inversa de A =
 1 2 31 1 1
−1 2 −1
 utilizando a matriz adjunta.
Precisamos calcular os 9 cofatores de A:
A11 = (−1)
1+1
det
ï
1 1
2 −1
ò
= −3; A12 = (−1)
1+2
det
ï
1 1
−1 −1
ò
= 0; A13 = (−1)
1+3
det
ï
1 1
−1 2
ò
= 3
A21 = (−1)
2+1
det
ï
2 3
2 −1
ò
= 8; A22 = (−1)
2+2
det
ï
1 3
−1 −1
ò
= 2; A23 = (−1)
2+3
det
ï
1 2
−1 2
ò
= −4
A31 = (−1)
3+1
det
ï
2 3
1 1
ò
= −1; A32 = (−1)
3+2
det
ï
1 1
3 1
ò
= 2; A33 = (−1)
3+3
det
ï
1 2
1 1
ò
= −1
Precisamos do determinante de A:
det
 1 2 31 1 1
−1 2 −1
 = −1− 2+ 6+ 3+ 2− 2 = 6
Logo,
A−1 = 1detA AdjA =
1
6
−3 8 −10 2 2
3 −4 −1

Regra de Cramer para Resolução de Sistemas Posśıveis e Determinados (SPD)
Podemos encontrar soluções de um Sistema de Cramer (portanto, um sistema linear posśıvel e determinado)
utilizando determinantes, via o seguinte resultado:
Proposição 6.9 (Regra de Cramer) Seja AX = B um Sistema de Cramer escrito em forma matricial, sendo
A =
a11 · · · a1n... ...
an1 · · · ann

n×n
, B =
b1...
bn

n×1
e X =
x1...
xn

n×1
.
Então,
xk =
det∆k
detA ,
sendo
∆k =
a11 · · · a1(k−1) b1 a1(k+1) · · · a1n... ... ... ... ...
an1 · · · an(k−1) bn an(k+1) · · · ann

n×n
(∆k é a matriz que se obter de A substituindo a k-ésima coluna pela matriz coluna B).
É importante enfatizar que a Regra de Cramer possui interesse teórico apenas. Comparado ao método de resolução
de sistemas lineares por escalonamento, a Regra de Cramer é extremamente ineficiente, devido ao fato de ser necessário
o cálculo de diversos determinantes (o que geralmente é bem trabalhoso). Quanto maior a ordem do sistema, maior é
a ineficiência desse método.
Exemplo 6.43 Resolvamos S =
 x + 2y + 3z = 142x − y + 3z = 9
−x − 2y + z = −2
utilizando a Regra de Cramer.
Temos A =
 1 2 32 −1 3
−1 −2 1
 ; B =
149
−2
 e X =
xy
z
. Temos também que detA = −1− 6− 12− 3− 4+ 6 = −20.
(i) det∆1 = det
14 2 39 −1 3
−2 −2 1
 = −14− 12− 54− 6− 18+ 84 = −20. Portanto, x1 = x = det∆1detA = −20−20 = 1.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 263 de 277 páginas
(ii) det∆2 = det
 1 14 32 9 3
−1 −2 1
 = 9− 42− 12+ 27− 28+ 6 = −40. Portanto, x2 = y = det∆2detA = −40−20 = 2.
(iii) det∆3 = det
 1 2 142 −1 9
−1 −2 −2
 = 2− 18− 56− 14+ 8+ 18 = −60. Portanto, x3 = z = det∆3detA = −60−20 = 3.
Conclusão: (x, y, z) = (1, 2, 3) é solução do sistema.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
GAAL UFU Página 283 de 351 páginas
Caṕıtulo 7
Espaços Vetoriais
Conforme comentado na apresentação do Caṕıtulo ??, página ??, nosso principal objetivo neste texto é o estudo
das chamadas transformações lineares. As transformações lineares estão para a Álgebra Linear, assim como as funções
reais de uma váriável real estão para o Cálculo Diferencial e Integral 1. No Cálculo 1 as funções possuem domı́nio e
contra-domı́nio no conjunto dos números reais R. Na Álgebra Linear as transformações lineares possuem domı́nio e
contra-domı́nio como sendo os chamados espaços vetoriais, que é o objeto de estudos deste caṕıtulo. Conceitos como
subespaço vetorial, base e dimensão de espaço vetorial são muito importantes e surgem de modo natural no estudo
das transformações lineares, principalmente no processo de diagonalização de operadores lineares, conforme veremos
no Caṕıtulo ??, página ??.
Cabe ressaltar que os exerćıcios ao final do caṕıtulosão parte importante dos estudos. Vários deles estão resolvidos
e, além de ajudarem como modelos para os exerćıcios propostos, complementam a teoria apresentada. Portanto, não
deixe de estudá-los.
7.1 O conceito de Espaço Vetorial
Motivação:
Seja V3 conjunto dos vetores do espaço euclidiano.
Podemos definir duas operações sobre V3: a adição
u
v
u v+
A
B C
u
v
e a multiplicação por escalar.
av < 1(a - )
v
av > 1(a )
a ( a )v 0 < < 1 a (- a )v 1 < < 0
Formalmente, escrevemos essas operações do seguinte modo:
+ : V3 × V3 −→ V3
(~u,~v) 7−→ ~u+~v é a operação de adição de vetores.
· : R× V3 −→ V3
(α, ~u) 7−→ α~u é a operação de multiplicação de vetor por escalar.
O conjunto V3 munido das operações acima cumpre as seguintes propriedades, geralmente estudadas em uma
disciplina de Geometria Anaĺıtica:
(1) Adição: sejam ~u,~v, ~w ∈ V3.
(i) ~u+ (~v+ ~w) = (~u+~v) + ~w (associativa);
(ii) ~u+~v = ~v+ ~u (comutativa);
(iii) ∃ ~0 ∈ V3 tal que ~u+~0 = ~0+ ~u = ~u (elemento neutro aditivo);
(iv) ∃ −~u ∈ V3 tal que ~u+ (−~u) = ~0 (elemento oposto).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 284 de 351 páginas UFU GAAL
(2) Multiplicação por escalar: sejam ~u,~v ∈ V3 e α,β ∈ R.
(i) α (β~u) = (αβ) ~u (associativa);
(ii) (α+ β) ~u = α~u+ β~u (distributiva em relação à adição de escalares);
(iii) α (~u+~v) = α~u+ α~v (distributiva em relação à adição de vetores);
(iv) 1~u = ~u (elemento neutro multiplicativo).
Nessas condições, dizemos que V3 munido das operações + e · possui estrutura vetorial e é chamado de espaço
vetorial sobre R, indicado por
(
V3,+, ·
)
.
Os conjuntos que possuem as mesmas propriedades de V3 serão chamados de espaços vetoriais. Abaixo segue a
definição formal:
Sejam V um conjunto não vazio e K um corpo numérico (K = R ou K = C). (1)
Dizemos que V é um espaço vetorial sobre K quando:
• (1) Existe uma operação de adição
+ : V × V −→ V
(u, v) 7−→ u+ v
satisfazendo, para quaisquer u, v,w ∈ V:
(1i) (u+ v) +w = u+ (v+w);
(1ii) u+ v = v+ u;
(1iii) ∃ 0 ∈ V tal que u+ 0 = 0+ u = u;
(1iv) ∃ −u ∈ V tal que u+ (−u) = 0.
• (2) Existe uma operação de multiplicação por escalar
· : K× V −→ V
(α, v) 7−→ αv
satisfazendo, para quaisquer u, v ∈ V e α,β ∈ K:
(2i) α (βu) = (αβ)u;
(2ii) (α+ β)u = αu+ βu;
(2iii) α (u+ v) = αu+ αv;
(2iv) 1u = u.
Quando K = R, chamamos V de espaço vetorial real e, quando K = C, chamamos V de espaço vetorial
complexo. Os elementos de V são comumente chamados de vetores, independente de sua natureza.
A menos que se diga o contrário, neste texto, a expressão espaço vetorial significa espaço vetorial real.
Tendo em vista a existência de elemento oposto para qualquer elemento de um espaço vetorial, é comum escrever
u+ (−v) como u− v, ou seja, u+ (−v) = u− v.
Exemplo 7.1 O conjuntoMm×n (R), das matrizesm×n comm linhas e n colunas, munido das operações de adição e
multiplicação por escalar usuais de matrizes é um espaço vetorial. Já vimos as propriedades operatórias na Proposição
??, página ??, do Caṕıtulo ??.
Exemplo 7.2 O conjunto V2 ou V3 de vetores no plano ou no espaço, munidos das operações de adição e multiplicação
por escalar usuais de vetores são espaços vetoriais. Usamos V3 no exemplo de motivação acima e a verificação das
propriedades operatórias geralmente é feita em uma disciplina de Geometria Anaĺıtica.
Exemplo 7.3 O próprio conjunto R dos números reais, munido das operaçõs de adição e multiplicação usuais, é
um espaço vetorial. Também o conjunto C dos números complexos, munido das operações de adição e multiplicação
usuais, é um espaço vetorial. A verificação das propriedades é simples.
Exemplo 7.4 (Importante) Quando introduzimos um sistema de coordenadas cartesianas ortogonais no plano ou
no espaço, podemos mudar o enfoque geométrico dos vetores em V2 e V3 para um enfoque algébrico desses vetores
em R2 e R3 por meio de coordenadas. Neste exemplo, podemos generalizar algebricamente o Exemplo 7.2 acima por
meio do conjunto Rn.
O conjunto Rn = {(x1, . . . , xn) : xi ∈ R} munido das operações
+ : Rn × Rn −→ Rn
((x1, . . . , xn) , (y1, . . . , yn)) 7−→ (x1 + y1, . . . , xn + yn)
1Em estudos mais abrangentes, K pode ser considerado qualquer corpo, inclusive, corpos finitos.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 285 de 351 páginas
e
· : R× Rn −→ Rn
(α, (x1, . . . , xn)) 7−→ (αx1, . . . , αxn) ,
ou seja, {
(x1, . . . , xn) + (y1, . . . , yn) = (x1 + y1, . . . , xn + yn)
α (x1, . . . , xn) = (αx1, . . . , αxn)
,
é um espaço vetorial.
Por exemplo, para n = 3 temos (1, 2, 3) + (4, 5, 6) = (5, 7, 9) e 2 (1, 2, 3) = (2, 4, 6).
Verifiquemos as propriedades operatórias:
• (1) Adição: sejam u = (x1, . . . , xn); v = (y1, . . . , yn) e w = (z1, . . . , zn) em Rn.
(1i) Associativa:
(u+ v) +w = ((x1, . . . , xn) + (y1, . . . , yn)) + (z1, . . . , zn) = (x1 + y1, . . . , xn + yn) + (z1, . . . , zn)
= ((x1 + y1) + z1, . . . , (xn + yn) + zn)
∗1= (x1 + (y1 + z1) , . . . , xn + (yn + zn))
= (x1, . . . , xn) + (y1 + z1, . . . , yn + zn) = (x1, . . . , xn) + ((y1, . . . , yn) + (z1, . . . , zn)) = u+ (v+w)
Em (∗1) usamos a propriedade associativa dos números reais.
(1ii) Comutativa:
u+ v = (x1, . . . , xn) + (y1, . . . , yn) = (x1 + y1, . . . , xn + yn)
∗2= (y1 + x1, . . . , yn + xn)
= (y1, . . . , yn) + (x1, . . . , xn) = v+ u
Em (∗2) usamos a propriedade comutativa dos números reais.
(1iii) Elemento neutro:
Seja 0 = (0, . . . , 0) ∈ Rn. Temos
u+ 0 = (x1, . . . , xn) + (0, . . . , 0) = (x1 + 0, . . . , xn + 0)
∗3= (x1, . . . , xn) = u
Em (∗3) usamos a propriedade do elemento neutro aditivo dos números reais.
(1iv) Elemento oposto:
Seja −u = (−x1, . . . ,−xn) ∈ Rn. Temos
u+ (−u) = (x1, . . . , xn) + (−x1, . . . ,−xn) = (x1 + (−x1) , . . . , xn + (−xn))
∗4= (0, . . . , 0) = 0
Em (∗4) usamos a propriedade do elemento oposto dos números reais.
• (2) Multiplicação por escalar: sejam u = (x1, . . . , xn) e v = (y1, . . . , yn) em Rn e α,β ∈ R.
(2i) Associativa:
α (βu) = α (β (x1, . . . , xn)) = α (βx1, . . . , βxn)
= (α (βx1) , . . . , α (βxn))
∗5= ((αβ) x1, . . . , (αβ) xn) = (αβ) (x1, . . . , xn) = (αβ)u
Em (∗5) usamos a propriedade associativa dos números reais.
(2ii) Distributiva em relação à adição de escalares:
(α+ β)u = (α+ β) (x1, . . . , xn) = ((α+ β) x1, . . . , (α+ β) xn)
∗6= (αx1 + βx1, . . . , αxn + βxn)
= (αx1, . . . , αxn) + (βx1, . . . , βxn) = α (x1, . . . , xn) + β (x1, . . . , xn) = αu+ βu
Em (∗6) usamos a propriedade distributiva dos números reais.
(2iii) Distributiva em relação à adição de elementos de Rn:
α (u+ v) = α ((x1, . . . , xn) + (y1, . . . , yn)) = α (x1 + y1, . . . , xn + yn)
= (α (x1 + y1) , . . . , α (xn + yn))
∗7= (αx1 + αy1, . . . , αxn + αyn)
= (αx1, . . . , αxn) + (αy1, . . . , αyn) = α (x1, . . . , xn) + α (y1, . . . , yn) = αu+ αv
Em (∗7) usamos a propriedade distributiva dos números reais.
(2iv) Elemento neutro multiplicativo:
1u = 1 (x1, . . . , xn) = (1x1, . . . , 1xn)
∗8= (x1, . . . , xn) = u
Em (∗8) usamos a propriedade do elemento neutro multiplicativo dos números reais.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 286 de 351 páginas UFU GAAL
Exemplo 7.5 Fixado n ∈ N, o conjunto Pn (R) = {p = anxn + · · ·+ a0 : ai ∈ R; x ∈ R variável} é o conjunto dos
polinômios com coeficientes reais de grau menor do que ou igual a n, acrescido do polinômio nulo (que não tem grau
definido) que, munido das operações
+ : Pn (R)× Pn (R) −→ Pn (R)
((anx
n + · · ·+ a0) , (bnxn + · · ·+ b0)) 7−→ (an + bn) xn + · · ·+ (a0 + b0)
e
· : R× Pn (R) −→ Pn (R)
(α, (anx
n + · · ·+ a0)) 7−→ (αan) xn + · · ·+ (αa0) ,
ou seja, {
(anx
n + · · ·+ a0) + (bnxn + · · ·+ b0) = (an + bn) xn + · · ·+ (a0 + b0)
α (anx
n+ · · ·+ a0) = (αan) xn + · · ·+ (αa0)
,
é um espaço vetorial.
Por exemplo, para n = 2 temos
(
3x2 + x
)
+
(
5x2 + 3
)
= 8x2 + x+ 3 e 2 (3x+ 1) = 6x+ 2.
Verificação das propriedades operatórias: exerćıcio proposto.
Exemplo 7.6 Seja I ⊂ R um intervalo aberto. O conjunto F (I) =
{
f : I ⊂ R −→ R
x 7−→ f (x)
}
é o conjunto das
funções reais, de uma váriável real, com domı́nio I que, munido das operações
+ : F (I)× F (I) −→ F (I)
(f, g) 7−→ f+ g : I ⊂ R −→ R
x 7−→ f (x) + g (x)
e
· : R× F (I) −→ F (I)
(α, f) 7−→ αf : I ⊂ R −→ R
x 7−→ αf (x) ,
ou seja, {
(f+ g) (x) = f (x) + g (x)
(αf) (x) = αf (x)
,
é um espaço vetorial.
Em particular, podemos tomar I = R e trabalhar com F (R) composto por funções com domı́nio R.
Por exemplo, para f (x) = x2; g (x) = ex e α = 2 temos (f+ g) (x) = x2 + ex e 2f (x) = 2x2.
Verifiquemos as propriedades operatórias referentes à adição:
• (1) Adição: sejam f, g, h em F (I).
(1i) Associativa:
((f+ g) + h) (x) = (f+ g) (x) + h (x) = (f (x) + g (x)) + h (x)
∗1= f (x) + (g (x) + h (x))
= f (x) + (g+ h) (x) = (f+ (g+ h)) (x) para qualquer x ∈ I.
Em (∗1) usamos a propriedade associativa dos números reais.
Portanto, (f+ g) + h = f+ (g+ h).
(1ii) Comutativa:
(f+ g) (x) = f (x) + g (x)
∗2= g (x) + f (x) = (g+ f) (x) para qualquer x ∈ I.
Em (∗2) usamos a propriedade comutativa dos números reais.
Portanto, f+ g = g+ f.
(1iii) Elemento neutro:
Seja 0 = θ sendo θ (x) = 0 para qualquer x ∈ I (θ é a função nula). Temos
(f+ 0) (x) = (f+ θ) (x) = f (x) + θ (x) = f (x) + 0
∗3= f (x) para qualquer x ∈ I.
Em (∗3) usamos a propriedade do elemento neutro aditivo dos números reais.
Portanto, f+ 0 = f.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 287 de 351 páginas
(1iv) Elemento oposto:
Seja −f ∈ F (I) tal que (−f) (x) = −f (x). Temos
(f+ (−f)) (x) = f (x) + (−f) (x) = f (x) + (−f (x))
∗4= 0 para qualquer x ∈ I.
Em (∗4) usamos a propriedade do elemento oposto dos números reais.
Portanto, f+ (−f) = 0. (0 = θ é a função nula)
Verificação das propriedades operatórias da multiplicação por escalar: exerćıcio proposto.
Nos exemplos acima introduzimos quatro dos principais espaços vetoriais, com as operações de adição e multi-
plicação por escalar que chamaremos de operações usuais. Esses espaços vetoriais aparecerão com muita frequência
em nosso texto. São eles:
• Rn: espaço das n-uplas ordenadas de números reais;
• Mm×n (R): espaço da matrizes reais de m linhas e n colunas;
• Pn (R): espaço dos polinômios com coeficientes reais de grau menor do que ou igual a n, com o polinômio nulo;
• F (I): espaço das funções reais, de uma variável real, com domı́nio I ⊂ R, sendo I intervalo aberto.
Há ainda um quinto tipo de espaço vetorial muito importante que veremos no Caṕıtulo 8, que é o espaço vetorial
cujos elementos são transformações lineares.
Cabe ressaltar que o espaço vetorial Rn, com as operações usuais, é especialmente importante na Matemática e,
vale a pena ressaltar a nomenclatura: R2 é espaço de pares ordenados (de números reais), R3 é espaço de ternas
(ou triplas) ordenadas, R4 é espaço de quádruplas ordenadas, R5 é espaço de qúıntuplas ordenadas, R6 é espaço de
sêxtuplas ordenadas, etc.
Também é importante ressaltar que um espaço vetorial está fortemente vinculado às operações definidas. Se
mudarmos o modo como uma das operação é definida em um dos conjuntos acima, ele pode deixar de ser um espaço
vetorial. Vejamos um exemplo.
Exemplo 7.7 (Não espaço vetorial) Verifiquemos que R2 munido das operações
+ : R2 × R2 −→ R2
((x1, y1) , (x2, y2)) 7−→ (x1 + x2, y1 + y2) e · : R× R2 −→ R2(α, (x, y)) 7−→ (αx, 0)
ou seja, {
(x1, y1) + (x2, y2) = (x1 + x2, y1 + y2)
α (x, y) = (αx, 0)
,
não é um espaço vetorial.
Observemos que a adição é a operação usual (e, portanto, as propriedade de adição se verificam), mas a multiplicação
por escalar não é a operação usual. Vamos verificá-la:
(2i)
{
α (β (x, y)) = α (βx, 0) = (α (βx) , 0) = ((αβ) x, 0)
(αβ) (x, y) = ((αβ) x, 0)
⇒ α (β (x, y)) = (αβ) (x, y) se verifica.
(2ii)
{
(α+ β) (x, y) = ((α+ β) x, 0) = (αx+ βx, 0) = (αx, 0) + (βx, 0)
α (x, y) + β (x, y) = (αx, 0) + (βx, 0)
⇒ (α+ β) (x, y) = α (x, y) + β (x, y) se ve-
rifica.
(2iii)
{
α ((x1, y1) + (x2, y2)) = α (x1 + x2, y1 + y2) = (α (x1 + x2) , 0) = (αx1 + αx2, 0)
α (x1, y1) + α (x2, y2) = (αx1, 0) + (αx2, 0) = (αx1 + αx2, 0)
⇒ α ((x1, y1) + (x2, y2)) =
α (x1, y1) + α (x2, y2) se verifica.
(2iv) 1 (x, y) = (1x, 0) = (x, 0) 6= (x, y) quando y 6= 0. Portanto, 1 (x, y) = (x, y) não se verifica.
Observação: a verificação das três primeiras propriedades pode causar estranheza pois, por exemplo, com 2 (3 (4, 29)) =
2 (12, 0) = (24, 0) e 6 (4, 73) = (24, 0) temos 2 (3 (4, 29)) = 6 (4, 73), mas (4, 29) 6= (4, 73)!!! Entretanto, se observarmos
mais atentamente, essa diferença de “forma” nos dois lados da igualdade também ocorre com a operação usual de
adição, por exemplo, com (1, 2) + (3, 4) = (4, 6) e (2, 1) + (2, 5) = (4, 6) temos (1, 2) + (3, 4) = (2, 1) + (2, 5), mas
(1, 2) 6= (2, 1) e (3, 4) 6= (2, 5).
Conclusão: R2 munido das operações acima não é um espaço vetorial.
A menos que se diga o contrário, Rn, Mm×n (R), Pn (R) e F (I) serão considerados com as operações usuais.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 288 de 351 páginas UFU GAAL
Proposição 7.1 (Propriedades de Espaços Vetoriais) Seja (V,+, ·) um espaço vetorial real.
(1) Em V vale a lei do cancelamento para a adição, ou seja, se u, v,w ∈ V e u+w = v+w, então u = v.
(2) Em V o elemento oposto de um elemento é único, ou seja, se u ∈ V, então existe um único v ∈ V tal que u+ v = 0,
sendo 0 o elemento neutro aditivo de V. (e, como já visto, denotamos v = −u)
(3) Em V o elemento neutro aditivo é único, ou seja, existe um único 0 ∈ V tal que u+ 0 = u para qualquer u ∈ V.
(4) Se α ∈ R e 0 ∈ V é o elemento neutro aditivo, então α0 = 0.
(5) Se u ∈ V e 0 ∈ R, então 0u = 0. (o primeiro 0 é o zero dos números reais, enquanto que o segundo 0 é o elemento
neutro aditivo de V)
(6) Se α ∈ R e u ∈ V são tais que αu = 0, então α = 0 ou u = 0. (o primeiro 0 é o zero dos números reais, enquanto
que o segundo 0 é o elemento neutro aditivo de V)
(7) Se α ∈ R e u ∈ V, então (−α)u = α (−u) = − (αu). (geralmente escrevemos o último membro de forma
simplificada: −(αu) = −αu)
(8) Sejam α,β ∈ R e u ∈ V, então (α− β)u = αu − (βu). (geralmente escrevemos a equação de forma simplificada:
(α− β)u = αu− βu)
(9) Sejam α ∈ R e u, v ∈ V, então α (u− v) = αu − (αv). (geralmente escrevemos a equação de forma simplificada:
α (u− v) = αu− αv)
Demonstração da Proposição 7.1.
(1) Como w ∈ V, existe o oposto −w ∈ V tal que w+ (−w) = 0, sendo 0 o elemento neutro aditivo.
Logo, u + w = v + w ⇒ (u+w) + (−w) = (v+w) + (−w) ⇒ u + (w+ (−w)) = v + (w+ (−w)) ⇒ u + 0 =
v+ 0⇒ u = v.
(2) Suponhamos que u ∈ V possua dois elementos opostos: −u1 e −u2 tais que u + (−u1) = 0 e u + (−u2) = 0,
sendo 0 o elemento neutro aditivo.
Logo, u+ (−u1) = u+ (−u2) = 0⇒ −u1 + u = −u2 + u⇒ −u1 = −u2. (pela lei o cancelamento para adição)
Outro modo de fazer: u+ (−u1) = 0 = u+ (−u2)⇒ −u1 + (u+ (−u1)) = −u1 + (u+ (−u2))⇒ (−u1 + u) +
(−u1) = (−u1 + u) + (−u2)⇒ (u− u1) + (−u1) = (u− u1) + (−u2)⇒ 0− u1 = 0− u2 ⇒ −u1 + 0 = −u2 + 0⇒
−u1 = −u2.
(3) Suponhamos que existam dois elementos neutros aditivos em V, indicados por 01 e 02, tais que u + 01 = u e
u+ 02 = u, sendo u ∈ V.
Logo, u+ 01 = u+ 02 ⇒ 01 + u = 02 + u⇒ 01 = 02. (pela lei o cancelamento para adição)
Outro modo de fazer: 01 + 02 = 01 e 02 + 01 = 02. Como 01 + 02 = 02 + 01 temos 01 = 02.
(4) 0 + α0 = α0 + 0 = α0 = α (0+ 0) = α0 + α0 ⇒ 0 = α0 ⇒ α0 = 0. (novamente a lei do cancelamento para
adição)
(5) 0+ 0u = 0u+ 0 = 0u = (0+ 0)u = 0u+ 0u⇒ 0 = 0u⇒ 0u = 0. (de novo: leido cancelamento para adição)
(6) Se α = 0 ∈ R, o resultado é óbvio.
Se α 6= 0 ∈ R, então existe α−1 ∈ R tal que α−1α = 1.
Assim, αu = 0⇒ α−1 (αu) = α−10⇒ (α−1α)u = 0⇒ 1u = 0⇒ u = 0.
(7) Primeira parte: −(αu) = α (−u).
De fato: αu+ (− (αu)) = 0 = α0 = α (u+ (−u)) = αu+ α (−u)⇒ −(αu) = α (−u). (lei do cancelamento)
Segunda parte: −(αu) = (−α)u.
De fato: αu+ (− (αu)) = 0 = 0u = (α+ (−α))u = αu+ (−α)u⇒ −(αu) = (−α)u. (lei do cancelamento)
(8) (α− β)u = (α+ (−β))u = αu+ (−β)u = αu+ (− (βu)) = αu− (βu).
(9) α (u− v) = α (u+ (−v)) = αu+ α (−v) = αu+ (− (αv)) = αu− (αv). �
Exemplo 7.8 Sendo V espaço vetorial e u, v,w ∈ V, calculemos 3u+v−3w e encontremos z ∈ V tal que u+z
2
− z−v
3
= w
para os seguintes casos:
(1) V = R3, u = (1, 2, 1), v = (2, 3, 1) e w = (1, 1, 1);
(2) V = P2 (R), u = t2, v = t e w = 2t+ 1;
(3) V = F (R), u = f (x) = 2x+ 2, v = g (x) = 3x+ 3 e w = h (x) = sen (x);
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 289 de 351 páginas
(4) V =M3×2 (R), u =
1 10 0
0 0
, v =
0 12 1
1 1
 e w =
1 21 0
0 −1
.
Quanto a 3u+ v− 3w temos:
• Para (1): 3u+ v− 3w = 3 (1, 2, 1) + (2, 3, 1) − 3 (1, 1, 1) = (2, 6, 1);
• Para (2): 3u + v − 3w = 3t2 + t − 3 (2t+ 1) = 3t2 − 5t − 3 (ou seja, 3u + v − 3w é o polinômio de grau 3
p (t) = 3t2 − 5t− 3);
• Para (3): 3u + v − 3w = 3 (2x+ 2) + (3x+ 3) − 3 sen (x) = 9x − 3 sen (x) + 9 (ou seja, 3u + v − 3w é a função real
r (x) = 9x− 3 sen (x) + 9);
• Para (4): 3u+ v− 3w = 3
1 10 0
0 0
+
0 12 1
1 1
− 3
1 21 0
0 −1
 =
 0 −2−1 1
1 4
.
Quanto a u+z
2
− z−v
3
= w, podemos utilizar as propriedades de espaço vetorial (que valem para todos esses
exemplos) e isolar o z:
u+z
2
− z−v
3
= w⇒ 3u+ 3z− (2z− 2v) = 6w⇒ z = −3u− 2v+ 6w.
Assim:
• Para (1): z = −3u− 2v+ 6w = −3 (1, 2, 1) − 2 (2, 3, 1) + 6 (1, 1, 1) = (−1,−6, 1);
• Para (2): z = −3u − 2v + 6w = −3t2 − 2t + 6 (2t+ 1) = −3t2 + 10t + 6 (ou seja, z é o polinômio de grau 3
p (t) = −3t2 + 10t+ 6);
• Para (3): z = −3u− 2v+ 6w = −3 (2x+ 2) − 2 (3x+ 3) + 6 sen (x) = −12x+ 6 sen (x) − 6 (ou seja, z é a função real
r (x) = −12x+ 6 sen (x) − 6);
• Para (4): z = −3u− 2v+ 6w = −3
1 10 0
0 0
− 2
0 12 1
1 1
+ 6
1 21 0
0 −1
 =
 3 72 −2
−2 −8
.
7.2 Subespaços Vetoriais
Sejam V um espaço vetorial real e U ⊂ V não vazio. Dizemos que U é um subespaço vetorial de V quando:
(1) ∀u, v ∈ U⇒ u+ v ∈ U;
(2) ∀α ∈ R e ∀u ∈ U⇒ αu ∈ U.
Observações:
(i) Devido à condição (2) da definição, o elemento neutro aditivo 0 ∈ V sempre estará em U, pois basta fazer α = 0 e
teremos 0u = 0 para qualquer u ∈ U. Portanto 0 ∈ U.
(ii) Obviamente, U também é um espaço vetorial, pois as operações de adição e multiplicação por escalar estão
“fechadas” em U e as oito propriedades da definição de espaço vetorial se verificam em U. Logo, podemos dizer que
um subespaço vetorial é um “espaço vetorial dentro de outro espaço vetorial”.
(iii) Alguns autores adotam a notação: U ⊂
se
V para designar U como um subespaço vetorial de V.
Exemplo 7.9 Seja V espaço vetorial, então U = V ou U = {0} são subespaços vetoriais triviais de V.
Exemplo 7.10 Seja R2 espaço vetorial, então U =
{
(x, y) ∈ R2 : x+ 2y = 0
}
é um subespaço vetorial de R2.
De fato:
(1) Para quaisquer (x1, y1) , (x2, y2) ∈ U temos{
x1 + 2y1 = 0
x2 + 2y2 = 0
⇒ (x1 + x2) + 2 (y1 + y2) = 0⇒ (x1 + x2, y1 + y2) ∈ U⇒ (x1, y1) + (x2, y2) ∈ U.
(2) Para quaisquer α ∈ R e (x, y) ∈ U temos{
x+ 2y = 0
α ∈ R ⇒ αx+ 2αy = 0⇒ (αx, αy) ∈ U⇒ α (x, y) ∈ U.
Observemos que o subespaço vetorial U é constitúıdo por pares ordenados que formam uma reta de equação
cartesiana y = −x
2
, que passa pela origem do plano cartesiano R2.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 290 de 351 páginas UFU GAAL
Exemplo 7.11 Sejam Mn (R) espaço vetorial e A ∈ Mn (R) matriz fixa, então U = {X ∈Mn (R) : AX = XA} é
subespaço vetorial de Mn (R).
De fato:
(1) Para quaisquer X, Y ∈ U temos{
AX = XA
AY = YA
⇒ AX+AY = XA+ YA⇒ A (X+ Y) = (X+ Y)A⇒ X+ Y ∈ U.
(2) Para quaisquer α ∈ R e X ∈ U temos{
AX = XA
α ∈ R ⇒ α (AX) = α (XA)⇒ A (αX) = (αX)A⇒ αX ∈ U.
Observemos que o subespaço vetorial U é constitúıdo por todas as matrizes quadradas de ordem n que comutam
com a matriz A.
Exemplo 7.12 Seja F (R) espaço vetorial, então U = {f ∈ F (R) : f (−x) = f (x)} é um subespaço vetorial de F (R).
De fato:
(1) Para quaisquer f, g ∈ U temos{
f (−x) = f (x)
g (−x) = g (x)
⇒ f (−x) + g (−x) = f (x) + g (x)⇒ (f+ g) (−x) = (f+ g) (x)⇒ f+ g ∈ U.
(2) Para quaisquer α ∈ R e f ∈ U temos{
f (−x) = f (x)
α ∈ R ⇒ α (f (−x)) = α (f (x))⇒ (αf) (−x) = (αf) (x)⇒ αf ∈ U.
Observemos que o subespaço vetorial U é constitúıdo por todas as funções pares com domı́nio R.
No espaço vetorial F (I) há vários subespaços vetoriais interessantes do ponto de vista matemático: seja k ∈ N, o
conjunto
Ck (I) =
{
f : I ⊂ R −→ R
x 7−→ f (x) : f é de classe Ck
}
é definido como sendo o conjunto das funções reais, de uma variável real, com domı́nio I, tais que existem, e são
cont́ınuas, suas derivadas até ordem k. Tais funções são ditas, em Matemática, funções de classe Ck em I. Se
incluirmos k = 0, definimos C0 (I) como sendo o subespaço vetorial de F (I) constitúıdo pelas funções cont́ınuas deste
espaço vetorial. Também temos o subespaço vetorial de F (I) constitúıdo pelas funções que possuem derivadas de
qualquer ordem, indicado por C∞ (I). É óbvia a seguinte cadeia de inclusões:
F (I) ⊃ C0 (I) ⊃ C1 (I) ⊃ C2 (I) ⊃ · · · ⊃ Ck (I) ⊃ Ck+1 (I) ⊃ · · · ⊃ C∞ (I) .
Exemplo 7.13 (Não subespaço vetorial) Verifiquemos que U =
{
(a, b, c) ∈ R3 : a > 0
}
não é subespaço vetorial
de R3.
É fácil perceber que se (a, b, c) , (a′, b′, c′) ∈ U, então (a, b, c) + (a′, b′, c′) = (a+ a′, b+ b′, c+ c′) ∈ U, pois
a+ a′ > 0.
No entanto, para α = −1 e (1, 1, 1) ∈ U, por exemplo, temos que (−1) (1, 1, 1) = (−1,−1,−1) /∈ U, pois −1 < 0.
Logo, U não é subespaço vetorial de R3.
A proposição abaixo fornece uma importante maneira de construir um subespaço vetorial a partir de outros dois.
Proposição 7.2 Intersecção de subespaços vetoriais é subespaço vetorial, ou seja, se U e W são subespaços
vetoriais do espaço vetorial real V, então U ∩W é, também, subespaço vetorial de V.
Demonstração da Proposição 7.2.
Verifiquemos as condições da definição de subespaço vetorial.
(1) ∀u, v ∈ U ∩W ⇒ u, v ∈ U e u, v ∈W ⇒ u+ v ∈ U e u+ v ∈W ⇒ u+ v ∈ U ∩W;
(2) ∀α ∈ R e u ∈ U ∩W ⇒ α ∈ R, u ∈ U e u ∈W ⇒ αu ∈ U e αu ∈W ⇒ αu ∈ U ∩W. �
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 291 de 351 páginas
Exemplo 7.14 (Bem simples) U =
{
(a, 0, 0) ∈ R3
}
e W =
{
(0, b, c) ∈ R3
}
são subespaços vetoriais de R3 (verifique
isso). É fácil ver que U ∩W = {(0, 0, 0)} é subespaço vetorial de R3.
A Proposição 7.2 diz que intersecção de subespaços vetoriais é subespaço vetorial. Mas, e com relação à reunião de
subespaços vetorais? A reunião seria um espaço vetorial? Infelizmente, a resposta nem sempre é positiva, conforme
podemos constatar no próximo exemplo.
Exemplo 7.15 (Reunião pode não ser subespaço) Mostremos, por meio de exemplos, que se U e W são su-
bespaços vetoriais do espaço vetorial V, então U ∪W nem sempre é subespaço vetorial de V.
De fato, consideremos os seguintes exemplos de subespaços vetoriais de R2:
U =
{
(x, y) ∈ R2 : x+ y = 0
}
W =
{
(x, y) ∈ R2 : x− y = 0
}
que, geometricamente, são retas que passam pela origem do plano cartesiano. (verifique isso)
Temos que A (−1, 1) ∈ U e B (1, 1) ∈W. Entretanto, A+ B = C (0, 2) /∈ U ∪W, pois x = 0 e y = 2 não satisfazem
x+ y = 0 ou x− y = 0.
Geometricamente temos a seguinte figura:
0 1
C 0 2( , )
x
1
2
y
WU
-1
A 1 1(- , ) B 1 1( , )
Soma de Subespaços Vetoriais
Conforme vimos,uma das maneiras de construir subespaços vetoriais é por meio da intersecção. Além desse modo,
podemos construir subespaços vetoriais por meio de soma (de subespaços), conforme definição e proposição abaixo.
Sejam V espaço vetorial real, U e W subespaços vetoriais de V. Definimos a soma de U com W, e indicamos
por U+W, como sendo o seguinte subconjunto de V:
U+W = {u+w : u ∈ U e w ∈W} ⊂ V .
Proposição 7.3 Soma de subespaços vetoriais é subespaço vetorial, ou seja, se U e W são subespaços vetoriais do
espaço vetorial real V, então U+W é, também, subespaço vetorial de V.
Demonstração da Proposição 7.3.
Verifiquemos as condições da definição de subespaço vetorial.
(1) v1, v2 ∈ U + W ⇒ v1 = u1 + w1 e v2 = u2 + w2 com u1, u2 ∈ U e w1, w2 ∈ W ⇒ u1 + u2 ∈ U e
w1 +w2 ∈W ⇒ (u1 + u2) + (w1 +w2) ∈ U+W ⇒ (u1 +w1) + (u2 +w2) ∈ U+W ⇒ v1 + v2 ∈ U+W.
(2) α ∈ R e v ∈ U+W ⇒ α ∈ R e v = u+w com u ∈ U e w ∈W ⇒ αu ∈ U e αw ∈W ⇒ αu+αw ∈ U+W ⇒
α (u+w) ∈ U+W ⇒ αv ∈ U+W. �
Observações: Sejam V espaço vetorial, U e W subespaços vetoriais de V. Temos:
(1) U+ {0} = U;
(2) U ⊂ U+W e W ⊂ U+W, ou seja, U e W são subespaços de U+W e, além disso, U ∪W ⊂ U+W.
(3) Se S é subespaço de V, então (U+W)+S também é subespaço de V. Genericamente, se S1, . . . , Sn são subespaços
de V, então S1 + · · ·+ Sn é subespaço de V.
Vimos que em um espaço vetorial, a reunião de dois de seus subespaços pode não ser um subespaço vetorial. Já a
soma é sempre subespaço vetorial e, portanto, soma e reunião não é a mesma coisa quando lidamos com subespaços.
Apesar disso, há uma relação interessante entre a soma e a reunião que é a seguinte: a soma de subespaços é o menor
subespaço vetorial que contém a reunião desses subespaços. Trata-se da próxima proposição.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 292 de 351 páginas UFU GAAL
Proposição 7.4 Se V é espaço vetorial real, U e W são subespaços vetoriais de V, então U+W é o menor subespaço
de V que contém U ∪W.
Demonstração da Proposição 7.4.
Seja L subespaço de V tal que U ⊂ L e W ⊂ L.
Mostremos que U+W ⊂ L e, como L é arbitrário, U+W será o menor subespaço que contém U ∪W.
Seja v ∈ U+W ⇒ v = u+w com u ∈ U e w ∈W ⇒ u ∈ L e w ∈ L⇒ u+w ∈ L (pois L é subespaço) ⇒ v ∈ L.
Logo, U+W ⊂ L, como queŕıamos. �
Exemplo 7.16 Sejam U =
{
(x, y, z) ∈ R3 : x = z
}
e W =
{
(x, y, z) ∈ R3 : x+ y+ z = 0
}
subespaços vetoriais de R3.
Encontremos U+W.
Primeiramente observemos que U e W são planos concorrentes que passam pela origem do sistema de coordenadas
cartesianas no espaço.
Temos
U+W =
{
(x, y, z) ∈ R3 : (x, y, z) = (x1, y1, z1) + (x2, y2, z2) com (x1, y1, z1) ∈ U e (x2, y2, z2) ∈W
}
=
{
(x, y, z) ∈ R3 : (x, y, z) = (x1, y1, x1) + (x2, y2,−x2 − y2)
}
=
{
(x, y, z) ∈ R3 : (x, y, z) = (x1 + x2, y1 + y2, x1 − x2 − y2)
}
Assim,  x1 + x2 = x .(-1)y1 + y2 = y
x1 − x2 − y2 = z
�
+
⇒
 x1 + x2 = xy1 + y2 = y
− 2x2 − y2 = z− x
Trata-se de um sistema linear SPI. Tomando, por exemplo, y2 = 0, temos x2 =
x−z
2
y1 = y
x1 = x− x2 = x−
x−z
2
= x+z
2
Assim, qualquer (x, y, z) ∈ R3 pode ser escrito como
(x, y, z)︸ ︷︷ ︸
∈R3
= (x1, y1, x1) + (x2, y2,−x2 − y2) =
(
x+z
2
, y, x+z
2
)︸ ︷︷ ︸
∈U
+
(
x−z
2
, 0, z−x
2
)︸ ︷︷ ︸
∈W
,
o que permite que concluamos que R3 ⊂ U+W. Como, obviamente, U+W ⊂ R3, conclúımos que U+W = R3.
Desta forma, o menor subespaço vetorial de R3 que contém os planos U e W é o próprio R3.
Observação: mais adiante veremos métodos mais simples e eficientes para encontrar subespaços soma U +W, como
os desse exemplo.
Soma Direta de Subespaços Vetoriais
Sejam V espaço vetorial real, U e W subespaços vetoriais de V. Dizemos que U+W é uma soma direta de U
com W, e indicamos por U⊕W, quando U ∩W = {0}.
Nesta situação ainda podemos dizer que W é um subespaço suplementar de U em V e vice-versa.
Exemplo 7.17 Aproveitando o Exemplo 7.14, página 291, vimos que U = {(a, 0, 0) : a ∈ R} e W = {(0, b, c) : b, c ∈ R}
são subespaços vetoriais de R3 e U ∩W = {(0, 0, 0)}. Sendo assim, temos U +W como soma direta de subespaços e
indicamos por U⊕W.
Exemplo 7.18 (Soma não direta) Aproveitando o Exemplo 7.16, página 292, determinamos U +W sendo U ={
(x, y, z) ∈ R3 : x = z
}
e W =
{
(x, y, z) ∈ R3 : x+ y+ z = 0
}
subespaços vetoriais de R3. A soma U+W não é direta.
Vejamos:
Seja (x, y, z) ∈ U ∩W ⇒ { x = z
x+ y+ z = 0
⇒ { x = z
y = −2z
.
Logo, U ∩W =
{
(x, y, z) ∈ R3 : x = z e y = −2z
}
= {(z,−2z, z) : z ∈ R} 6= {(0, 0, 0)}.
Conclusão: U+W não é soma direta.
Observemos que U∩W é uma reta que passa pela origem de R3 e possui vetor diretor u = (1,−2, 1), por exemplo.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 293 de 351 páginas
Uma pergunta natural a esta altura: qual é a importância do conceito de soma direta de subespaços? Antes de
responder a pergunta, observemos que no Exemplo 7.16, podemos escrever um elemento qualquer de R3 como soma
de elementos de U e W de diversas maneiras, por exemplo,
(1, 2, 3) = (2, 2, 2)︸ ︷︷ ︸
∈U
+ (−1, 0, 1)︸ ︷︷ ︸
∈W
=
(
5
2
, 1, 5
2
)︸ ︷︷ ︸
∈U
+
(
−3
2
, 1, 1
2
)︸ ︷︷ ︸
∈W
.
A importância da soma direta é justamente para evitar essa situação, ou seja, quando uma soma de subespaços é
direta, um elemento dessa soma direta é sempre escrito de modo único como soma de elementos de cada subespaço.
Este é o conteúdo da próxima proposição.
Proposição 7.5 (Unicidade da soma) Sejam V espaço vetorial real, U e W subespaços vetoriais de V. Temos:
S = U +W é soma direta, ou seja, S = U ⊕W se, e somente se, para qualquer v ∈ S, existem, e são únicos, u ∈ U e
w ∈W tais que v = u+w.
Demonstração da Proposição 7.5.
(⇒) Suponhamos que v = u1 +w1 e v = u2 +w2 com u1, u2 ∈ U e w1, w2 ∈W ⇒ u1 +w1 = u2 +w2 ⇒
u1 − u2︸ ︷︷ ︸
∈U
= w2 −w1︸ ︷︷ ︸
∈W
∈ U ∩W.
Como a soma é direta temos
{
u1 − u2 = 0
w2 −w1 = 0
⇒ { u1 = u2
w1 = w2
. Logo, a decomposição de v como soma de
elementos de U e W é única.
(⇐) Seja v ∈ U ∩W ⇒ v ∈ U e v ∈W. Sejam u ∈ U e w ∈W quaisquer. Temos u↓
∈U
+ w↓
∈W
= (u− v)︸ ︷︷ ︸
∈U
+ (w+ v)︸ ︷︷ ︸
∈W
.
Mas, por hipótese, o elemento u + w é escrito de maneira única como soma de elementos de U e W. Logo,
u = u− v e w = w+ v⇒ v = 0.
Conclusão U ∩W = {0} e, portanto, a soma é direta.
Por fim, observemos que a hipótese garante que todo v ∈ S é escrito como soma de elementos de U e W.
Portanto, S = U⊕W. �
Observação. Embora a Proposição 7.5 acima seja importante do ponto de vista teórico, na prática, geralmente é
mais fácil provar que S = U ⊕W verificando que S = U +W (S é uma soma de dois subespaços) e que U ∩W = {0}
(a soma é direta).
Exemplo 7.19 Sejam P ⊂ F (R) subespaço vetorial das funções reais pares com domı́nio R e I ⊂ F (R) subespaço
vetorial das funções reais ı́mpares com domı́nio R. Mostremos que F (R) = P ⊕ I.
Temos
P = {g ∈ F (R) : g (−x) = g (x)}
I = {h ∈ F (R) : h (−x) = −h (x)}
(i) Dada f ∈ F (R), definamos g (x) = 1
2
(f (x) + f (−x)) e h (x) = 1
2
(f (x) − f (−x)) .
Observemos que:
g (−x) = 1
2
(f (−x) + f (− (−x))) = 1
2
(f (−x) + f (x)) = 1
2
(f (x) + f (−x)) = g (x) . Logo, g ∈ P.
h (−x) = 1
2
(f (−x) − f (− (−x))) = 1
2
(f (−x) − f (x)) = −1
2
(f (x) − f (−x)) = −h (x) . Logo, h ∈ I.
Mas
g (x)︸︷︷︸
∈P
+ h (x)︸ ︷︷ ︸
∈I
= 1
2
(f (x) + f (−x)) + 1
2
(f (x) − f (−x)) = f (x)⇒ f = g+ h.
Portanto, F (R) ⊂ P + I. Como, obviamente, P + I ⊂ F (R), então F (R) = P + I.
(ii) Seja f ∈ P ∩ I. Temos{
f (x) = f (−x)
f (x) = −f (−x)
⇒ f (−x) = −f (−x)⇒ f (x) = −f (x) (pois f (x) = f (−x) )⇒ 2f (x) = 0⇒ f (x) = 0
para qualquer x ∈ R.
Logo, P ∩ I = {0} e, portanto, a soma é direta.
Conclusão: F (R) = P ⊕ I.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 294 de 351 páginas UFU GAAL
7.3 Combinações Lineares eEspaços Gerados
Combinações Lineares
O conceito de combinação linear é fundamental para avançarmos no estudo de espaços e subespaços vetoriais. É a
partir dessas combinações que construiremos novos subespaços e lançaremos um novo olhar sobre a forma com que os
elementos de um espaço vetorial são escritos. Vamos à definição:
Seja V um espaço vetorial real. Dizemos que v ∈ V é combinação linear de v1, . . . , vn ∈ V quando existirem
α1, . . . , αn ∈ R tais que
v = α1v1 + · · ·+ αnvn .
Os escalares α1, . . . , αn são chamados de coeficientes da combinação linear.
Exemplo 7.20 Sejam V = R3, v1 = (1, 0, 0), v2 = (0, 1, 0) e v3 = (0, 0, 1) em R3. Temos que v = (2, 2, 3) =
2 (1, 0, 0) + 2 (0, 1, 0) + 3 (0, 0, 1) é combinação linear de v1, v2 e v3.
Exemplo 7.21 Sejam v1 = (1, 1,−1), v2 = (2, 1, 0) e v3 = (0, 1, 1) em R3. Vejamos se é posśıvel escrever v = (2, 2, 3)
como combinação linear de v1, v2 e v3.
Sejam α1, α2 e α3 ∈ R tais que:
v = α1v1 + α2v2 + α3v3 ⇒ (2, 2, 3) = α1 (1, 1,−1) + α2 (2, 1, 0) + α3 (0, 1, 1)⇒
(2, 2, 3) = (α1 + 2α2, α1 + α2 + α3,−α1 + α3)⇒
 α1 + 2α2 = 2α1 + α2 + α3 = 2
−α1 + α3 = 3
⇒ · · ·⇒
 α1 = −4/3α2 = 5/3
α3 = 5/3
Logo, (2, 2, 3) = −4
3
(1, 1,−1) + 5
3
(2, 1, 0) + 5
3
(0, 1, 1).
Conjuntos Geradores de Subespaços Vetoriais
O conjunto de todas as combinações lineares posśıveis de um subconjunto de elementos de um espaço vetorial
desempenha um papel muito importante na Álgebra Linear, conforme proposição abaixo.
Proposição 7.6 (Subespaço vetorial gerado por conjunto) Sejam V espaço vetorial real e S ⊂ V um conjunto não
vazio.
(1) Para S = {v1, . . . , vn} finito, consideremos
[S] = {α1v1 + · · ·+ αnvn : α1, . . . , αn ∈ R} ⊂ V .
(2) Para S = {v1, v2, . . .} infinito, consideremos
[S] = {v ∈ V : ∃v1, . . . , vn ∈ S e ∃α1, . . . , αn ∈ R tais que v = α1v1 + · · ·+ αnvn} ⊂ V .
Então, [S] é subespaço vetorial de V.
Demonstração da Proposição 7.6.
Faremos a demonstração apenas do caso (1). O outro caso é deixado como exerćıcio para o leitor.
Seja S ⊂ V finito e não vazio.
(i) Sejam u, v ∈ [S]. Então,{
u = α1v1 + · · ·+ αnvn
v = β1v1 + · · ·+ βnvn
⇒ u+ v = (α1 + β1)︸ ︷︷ ︸
γ1
v1 + · · ·+ (αn + βn)︸ ︷︷ ︸
γn
vn = γ1v1 + · · ·+ γnvn ∈ [S] .
(ii) Sejam α ∈ R e u ∈ [S]. Então,
α ∈ R e u = α1v1 + · · ·+ αnvn ⇒ αu = (αα1)︸ ︷︷ ︸
δ1
v1 + · · ·+ (ααn)︸ ︷︷ ︸
δn
vn = δ1v1 + · · ·+ δnvn ∈ [S] .
Portanto, [S] é subespaço vetorial de V. �
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 295 de 351 páginas
Nas condições da Proposição 7.6 acima, [S] é chamado de subespaço vetorial de V gerado por S. Os elementos
de S são chamados de geradores de [S]. Também podemos escrever [S] = [v1, . . . , vn], no caso de S finito, ou
[S] = [v1, v2, . . .], no caso de S infinito.
Excepcionalmente, quando S = ∅, convencionamos que [S] = {0}. Assim, S = ∅ ou S = {0} são tais que [S] = {0}.
Observemos que nas condições do Item (2) da Proposição 7.6 acima, quando S é infinito, todo v ∈ [S] é escrito
como uma combinação linear, portanto, uma soma envolvendo quantidades finitas de coeficientes e elementos de S.
A definição do espaço vetorial [S] do modo como foi feita na proposição, com S infinito, é para evitarmos trabalhar
com somas infinitas, ou seja, séries. Sabemos que séries podem ou não convergir, o que tornaria nosso trabalho mais
dif́ıcil (o estudo de séries numéricas ou de funções geralmente é feito em um curso de Cálculo).
Exemplo 7.22 Sejam V = R2 e S = {(1, 0) , (1, 1)}. Mostremos que [S] = R2.
Seja (x, y) ∈ R2 arbitrário. Mostremos que existem α,β ∈ R tais que
(x, y) = α (1, 0) + β (1, 1)⇒ (x, y) = (α+ β,β)⇒ { α + β = x
β = y
⇒ { α = x− y
β = y
,
ou seja, (x, y) = (x− y) (1, 0) + y (1, 1) e podemos escrever qualquer elemento de R2 como combinação linear de (1, 0)
e (1, 1). Isto significa, então, que (x, y) ∈ [S]. Logo, R2 ⊂ [S].
Como, naturalmente, [S] ⊂ R2, temos [S] = R2.
Exemplo 7.23 Sejam V = R3 e S = {(1,−2,−1) , (2, 1, 1)}. Determinemos [S].
Seja (x, y, z) ∈ [S]. Logo, existem α,β ∈ R tais que
(x, y, z) = α (1,−2,−1) + β (2, 1, 1)⇒ (x, y, z) = (α+ 2β,−2α+ β,−α+ β)⇒ α + 2β = x .(2) .(1)− 2α + β = y �+
− α + β = z
�
+
⇒
 α + 2β = x5β = 2x + y .(-3/5)
3β = x + z
�
+
⇒

α + 2β = x
5β = 2x + y
0 = −1
5
x − 3
5
y + z
.
A última linha pode ser reescrita como x+ 3y− 5z = 0.
Assim, para que (x, y, z) ∈ [S] possa ser escrito como combinação linear de elementos de S é necessário que
x+ 3y− 5z = 0 (caso contrário, o sistema é imposśıvel).
Logo, [S] =
{
(x, y, z) ∈ R3 : x+ 3y− 5z = 0
}
⊂ R3 (geometricamente, [S] é um plano que contém a origem do R3).
Exemplo 7.24 (Conjunto gerador infinito) Seja V = R∞ = {(x1, x2, . . .) : xi ∈ R} o espaço vetorial das sequências
numéricas reais com as operações usuais (a verificação de que R∞ é, de fato, espaço vetorial é deixada como exerćıcio
proposto). Seja
S = {(1, 0, 0, 0, 0, . . .) , (0, 1, 0, 0, 0, . . .) , (0, 0, 1, 0, 0, . . .) , (0, 0, 0, 1, 0, . . .) , . . .} ⊂ V.
O elemento v = (2, 1, 3, 2, 0, 0, 0, . . .) ∈ [S], pois existem em S os elementos
v1 = (1, 0, 0, 0, 0, . . .)
v2 = (0, 1, 0, 0, 0, . . .)
v3 = (0, 0, 1, 0, 0, . . .)
v4 = (0, 0, 0, 1, 0, . . .)
e α1 = 2, α2 = 1, α3 = 3, α4 = 2 ∈ R tais que v = α1v1 + α2v2 + α3v3 + α4v4, ou seja,
(2, 1, 3, 2, 0, 0, 0, . . .) = 2 (1, 0, 0, 0, 0, . . .) + 1 (0, 1, 0, 0, 0, . . .) + 3 (0, 0, 1, 0, 0, . . .) + 2 (0, 0, 0, 1, 0, . . .) .
Já o elemento v = (1, 2, 3, 4, 5, . . .) /∈ [S], pois não existe uma quantidade finita de elementos de S tais que v seja
combinação linear desses elementos. Desta forma, [S] é subespaço vetorial próprio (isto é, diferente) de R∞.
É fácil perceber que [S] é constitúıdo por “sequências finitas”, ou seja, sequências que são nulas a partir de um
certo termo.
Proposição 7.7 (Propriedades de subespaços gerados) Seja V espaço vetorial real e S = {v1, . . . , vn} ⊂ V. Então:
(i) S ⊂ [S];
(ii) S1 ⊂ S2 ⊂ V ⇒ [S1] ⊂ [S2] ⊂ V;
(iii) [S] = [[S]];
(iv) S1, S2 ⊂ V ⇒ [S1 ∪ S2] = [S1] + [S2].
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 296 de 351 páginas UFU GAAL
Demonstração da Proposição 7.7.
(i) Seja vi ∈ S. Então, vi = 0v1 + · · ·+ 0vi−1 + 1vi + 0vi+1 + · · ·+ 0vn ∈ [S]. Logo, S ⊂ [S].
(ii) Neste item façamos S1 = {u1, . . . , um} e S2 = {w1, . . . , wn} (esses conjuntos não precisam ter a mesma quan-
tidade de elementos) e, como S1 ⊂ S2, temos m 6 n e, sem perda de generalidade, suponhamos que u1 = w1,
u2 = w2, . . ., um = wm.
Seja v ∈ [S1]⇒ v = α1u1+ · · ·+αmum = α1w1+ · · ·+αmwm = α1w1+ · · ·+αmwm+ 0wm+1+ · · ·+ 0wn ⇒
v ∈ [S2]. Logo, [S1] ⊂ [S2].
(iii) Seja v ∈ [S]. Então, v =
n∑
i=1
αivi, sendo vi ∈ S. Do item (i) temos vi ∈ [S], o que significa que v é escrito como
um soma finita envolvendo elementos de [S], ou seja, v ∈ [[S]]. Logo, [S] ⊂ [[S]].
Quanto à inclusão contrária:
Seja v ∈ [[S]]⇒ v = m∑
j=1
βjuj com uj ∈ [S] (soma finita!). Mas uj =
n∑
i=1
αivi com vi ∈ S. Logo,
v =
m∑
j=1
Å
βj
n∑
i=1
αivi
ã
=
m∑
j=1
Å
n∑
i=1
βjαivi
ã
=
n∑
i=1
Ç
m∑
j=1
βjαi
å
︸ ︷︷ ︸
γi
vi =
n∑
i=1
γivi ⇒ v ∈ [S].
Portanto, [[S]] ⊂ [S].
Conclusão: [S] = [[S]].
(iv) Neste item façamos S1 = {u1, . . . , um} e S2 = {w1, . . . , wn} (esses conjuntos não precisam ter a mesma
quantidade de elementos).
Temos
v ∈ [S1 ∪ S2]⇐⇒ v = α1u1 + · · ·+ αmum︸ ︷︷ ︸
∈[S1]
+ β1w1 + · · ·+ βnwn︸ ︷︷ ︸
∈[S2]
⇐⇒ v ∈ [S1] + [S2].
Logo, [S1 ∪ S2] = [S1] + [S2]. �
Observação: Se S é um espaço vetorial, então S = [S].
De fato, se v ∈ [S], então v = α1v1 + · · ·+ αnvn︸ ︷︷ ︸
∈S
, ou seja, v ∈ S, pois S é espaço vetorial. Portanto, [S] ⊂ S.
Se v ∈ S, então v = 1v ∈ [S], pois [S] é formado por combinações lineares (somas finitas) de elementos de S.
Portanto, S ⊂ [S].
Conclusão: S = [S].
Espaços Vetoriais Finitamente Gerados
Até agora,os exemplos que trabalhamos foram para encontrar o espaço vetorial a partir de um conjunto de
geradores. Agora, vamos analisar o problema inverso: a partir de um espaço vetorial dado é posśıvel encontrar um
conjunto de geradores para ele? A resposta vai depender do espaço dado. Antes porém, mais uma definição:
Dizemos que um espaço vetorial real V é finitamente gerado quando existe S ⊂ V finito tal que V = [S].
Exemplo 7.25 Verifiquemos se os subespaços vetoriais abaixo são finitamente gerados. Em caso afirmativo, deter-
minemos conjuntos geradores:
(1) U =
{
(x, y, z) ∈ R3 : x− y = 0
}
⊂ R3.
Temos
U =
{
(x, y, z) ∈ R3 : x− y = 0
}
=
{
(x, y, z) ∈ R3 : x = y
}
=
{
(x, x, z) ∈ R3
}
= {x (1, 1, 0) + z (0, 0, 1) : x, z ∈ R} = [(1, 1, 0) , (0, 0, 1)] .
Logo, S = {(1, 1, 0) , (0, 0, 1)} gera U e, portanto, U é finitamente gerado.
Observemos que S é constitúıdo por vetores diretores do plano U.
(2) V =
{
(x, y, z, t) ∈ R4 : x− y = z+ t = 0
}
⊂ R4.
Temos
V =
{
(x, y, z, t) ∈ R4 : x− y = z+ t = 0
}
=
{
(x, y, z, t) ∈ R4 : y = x e z = −t
}
=
{
(x, x,−t, t) ∈ R4
}
= {x (1, 1, 0, 0) + t (0, 0,−1, 1) : x, t ∈ R} = [(1, 1, 0, 0) , (0, 0,−1, 1)] .
Logo, S = {(1, 1, 0, 0) , (0, 0,−1, 1)} gera V e, portanto, V é finitamente gerado.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 297 de 351 páginas
(3) W =
{
(x, y, z, t) ∈ R4 : x− y− z+ t = 0
}
⊂ R4.
Temos
W =
{
(x, y, z, t) ∈ R4 : x− y− z+ t = 0
}
=
{
(x, y, z, t) ∈ R4 : x = y+ z− t
}
=
{
(y+ z− t, y, z, t) ∈ R4
}
= {y (1, 1, 0, 0) + z (1, 0, 1, 0) + t (−1, 0, 0, 1) : y, z, t ∈ R} = [(1, 1, 0, 0) , (1, 0, 1, 0) , (−1, 0, 0, 1)] .
Logo, S = {(1, 1, 0, 0) , (1, 0, 1, 0) , (−1, 0, 0, 1)} gera W e, portanto, W é finitamente gerado.
Exemplo 7.26 Se U = [(1, 0, 0) , (1, 1, 1)] ⊂ R3 e V = [(0, 1, 0) , (0, 0, 1)] ⊂ R3, encontremos um conjunto gerador
para U ∩ V e verifiquemos se é finitamente gerado.
Temos
v ∈ U ∩ V ⇒ { v = α (1, 0, 0) + β (1, 1, 1)
v = γ (0, 1, 0) + δ (0, 0, 1)
⇒ v = (α+ β,β, β) = (0, γ, δ)⇒
 α+ β = 0⇒ α = −βγ = β
δ = β
⇒
{
v = −β (1, 0, 0) + β (1, 1, 1)
v = β (0, 1, 0) + β (0, 0, 1)
⇒ { v = (−β+ β,β, β)
v = (0, β, β)
⇒ v = (0, β, β) = β (0, 1, 1) com β ∈ R⇒ v ∈ [(0, 1, 1)]
Logo, U ∩ V ⊂ [(0, 1, 1)].
Quanto à inclusão contrária, observemos que (0, 1, 1) = − (1, 0, 0) + (1, 1, 1)⇒ (0, 1, 1) ∈ U⇒ [(0, 1, 1)] ⊂ [U] = U
(pois U é espaço vetorial). Analogamente, (0, 1, 1) = (0, 1, 0) + (0, 0, 1)⇒ (0, 1, 1) ∈ V ⇒ [(0, 1, 1)] ⊂ [V ] = V (pois V
é espaço vetorial). Logo, [(0, 1, 1)] ⊂ U ∩ V.
Conclusão: U ∩ V = [(0, 1, 1)] e S = {(0, 1, 1)} é conjunto gerador para U ∩ V e, portanto, U ∩ V é finitamente
gerado.
Exemplo 7.27 O espaço vetorial R3 é finitamente gerado:
R3 = [(1, 0, 0) , (0, 1, 0) , (0, 0, 1)] .
De fato, [(1, 0, 0) , (0, 1, 0) , (0, 0, 1)] ⊂ R3 (óbvio).
Seja (x, y, z) ∈ R3 ⇒ (x, y, z) = x (1, 0, 0) + y (0, 1, 0) + z (0, 0, 1)⇒ (x, y, z) ∈ [(1, 0, 0) , (0, 1, 0) , (0, 0, 1)].
Logo, R3 ⊂ [(1, 0, 0) , (0, 1, 0) , (0, 0, 1)].
Conclusão: R3 = [(1, 0, 0) , (0, 1, 0) , (0, 0, 1)].
Exemplo 7.28 (Generalização do exemplo anterior) Rn é finitamente gerado:
Rn = [(1, 0, 0, . . . , 0) , (0, 1, 0, . . . , 0) , . . . , (0, . . . , 0, 1)] .
Exemplo 7.29 O espaço vetorial Pn (R) é finitamente gerado:
Pn (R) =
[
1, x, x2, . . . , xn
]
.
Exemplo 7.30 O espaço vetorial M2 (R) é finitamente gerado:
M2 (R) =
{ï
1 0
0 0
ò
,
ï
0 1
0 0
ò
,
ï
0 0
1 0
ò
,
ï
0 0
0 1
ò}
.
Exemplo 7.31 (Espaço não finitamente gerado) Seja
V = P (R) = {p = anxn + · · ·+ a0 : ai ∈ R, n ∈ N e x ∈ R variável}
o espaço vetorial dos polinômios com coeficientes reais munido das operações usuais (a verificação de que P (R) é, de
fato, espaço vetorial é deixada como exerćıcio proposto). Temos que P (R) não é finitamente gerado.
De fato, seja S = {p1, p2, . . . , pn} ⊂ P (R). Logo, existe pk ∈ S de grau máximo. Suponhamos que o grau do
polinômio pk seja m. Tomemos p ∈ P (R) tal que p possui grau maior do que m. Logo, o polinômio p não pode ser
escrito como combinação linear de p1, . . . , pn. Portanto, P (R) 6= [S] para qualquer S finito.
Proposição 7.8 Todo subespaço vetorial de um espaço vetorial real finitamente gerado é, também, finitamente
gerado, ou seja, se V é espaço vetorial real finitamente gerado e U é subespaço vetorial de V, então U é finitamente
gerado.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 298 de 351 páginas UFU GAAL
Demonstração da Proposição 7.8.
Seja U subespaço vetorial de V, espaço vetorial real finitamente gerado.{
Se U = {0}, então S = ∅ ou S = {0} e U é finitamente gerado.
Se U 6= {0}, então existe u1 ∈ V com u1 6= 0.{
Se U = [u1] = {α1u1 : α1 ∈ R}, então U é finitamente gerado.
Se U 6= [u1], então existe u2 6= α1u1, u2 ∈ V.{
Se U = [u1, u2] = {α1u1 + α2u2 : α1, α2 ∈ R}, então U é finitamente gerado.
Se U 6= [u1, u2], então existe u3 6= α1u1 + α2u2, u3 ∈ V.{
Se U = [u1, u2, u3] = {α1u1 + α2u2 + α3u3 : α1, α2, α3 ∈ R}, então U é finitamente gerado.
Se U 6= [u1, u2, u3], então existe u4 6= α1u1 + α2u2 + α3u3, u4 ∈ V.
e o processo de construção se repete.
Esse procedimento chegará ao fim, ou seja, U = [u1, u2, . . . , un], pois, caso contrário, existiria em V um elemento
que jamais poderia ser escrito como combinação linear de elementos de V, contrariando o fato de que V é finitamente
gerado. �
Neste texto trabalharemos apenas com espaços vetoriais finitamente gerados
7.4 Dependência e Independência Linear
Conjuntos Linearmente Independentes (LI) e Conjuntos Linearmente Dependentes (LD)
Sejam V espaço vetorial real e S = {v1, . . . , vn} ⊂ V. Dizemos que S é um conjunto linearmente independente
(LI) quando ocorrer:
α1v1 + α2v2 + · · ·+ αnvn = 0⇒ α1 = α2 = · · · = αn = 0 .
Caso contrário, dizemos que S é um conjunto linearmente dependente (LD).
Com certo abuso de linguagem, também se pode dizer que v1, . . . , vn são LI, ou LD.
Por convenção, S = ∅ é considerado LI.
Exemplo 7.32 Sejam V = R3 e S = {(1, 0, 0) , (0, 1, 0) , (0, 0, 1)}. O conjunto S é LI.
De fato, sejam α1, α2, α3 ∈ R tais que α1 (1, 0, 0) + α2 (0, 1, 0) + α3 (0, 0, 1) = (0, 0, 0)⇒ (α1, α2, α3) = (0, 0, 0)⇒
α1 = α2 = α3 = 0. Logo, S é LI.
Exemplo 7.33 Sejam V = R3 e S = {(1, 0, 0) , (0, 1, 0) , (1, 2, 0) , (0, 1, 1)}. O conjunto S é LD.
De fato, sejam α1, α2, α3, α4 ∈ R tais que
α1 (1, 0, 0) + α2 (0, 1, 0) + α3 (1, 2, 0) + α4 (0, 1, 1) = (0, 0, 0)⇒
(α1 + α3, α2 + 2α3 + α4, α4) = (0, 0, 0) .
Logo,  α1 + α3 = 0α2 + 2α3 + α4 = 0
α4 = 0
,
que é um sistema linear escalonado com mais variáveis do que linhas, ou seja, um sistema linear posśıvel e indeterminado
(SPI). Portanto, há infinitas soluções. A solução trivial (todos os α′s nulos) é apenas uma delas. Um exemplo de
solução não trivial é α1 = 1, α2 = 2, α3 = −1 e α4 = 0.
Logo, S é LD.
Exemplo 7.34 Verifiquemos se S = {eax cos (bx) , eax sen (bx)} ⊂ F (R), com a e b constantes reais sendo b 6= 0, é LI
ou LD.
Sejam α1, α2 ∈ R tais que α1 (eax cos (bx)) + α2 (eax sen (bx)) = 0⇒ α1 cos (bx) + α2 sen (bx) = 0 (pois eax 6= 0
para qualquer x ∈ R).
Mas a igualdade deve valer para qualquer x ∈ R.
Para x = 0 temos α1 cos (0) + α2 sen (0) = 0⇒ α11+ α20 = 0⇒ α1 = 0.
Para x = π
2b
temos α1 cos
(
b π
2b
)
+ α2 sen
(
b π
2b
)
= 0⇒ α1 cos (π2 )+ α2 sen (π2 ) = 0⇒ α10+ α21 = 0⇒ α2 = 0.
Logo, α1 = α2 = 0. Portanto, S é LI.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 299 de 351 páginas
Propriedades da Dependência e da Independência Linear
Temos oito propriedades envolvendo dependência (e independência) linear. Vamos apresentá-las por meio de
questões e exemplos antes de enunciá-las (o que está feito em azul) e justificá-las.
• (1) Sendo V um espaço vetorial e S um conjunto finito S ⊂ V, que contém o elemento neutro de V, é LI ou LD?Exemplo: V = R2 e S = {(0, 0) , (1, 2) , (1, 1)} é LI ou LD?
Sejam α1, α2, α3 ∈ R tais que α1 (0, 0) + α2 (1, 2) + α3 (1, 1) = (0, 0). Podemos tomar, por exemplo, α1 = 1,
α2 = α3 = 0. Logo, S é LD.
Propriedade P1. Se V é espaço vetorial, S ⊂ V é finito e 0 ∈ S, então S é LD.
Justificativa: Sejam S = {0, u2, . . . , un} e α1, α2, . . . , αn ∈ R tais que α10 + α2u2 + · · · + αnun = 0. Tomando
α1 6= 0 e α2 = · · · = αn = 0, a igualdade envolvendo a combinação linear fica satisfeita sem que todos os coeficientes
seja nulos. Logo, S é LD.
• (2) Um conjunto unitário S = {u} ⊂ V, sendo V espaço vetorial e u 6= 0, é LI ou LD?
Exemplo: V = R2 e S = {(1, 1)} é LI ou LD?
Seja α ∈ R tal que α (1, 1) = (0, 0)⇒ (α,α) = (0, 0)⇒ α = 0. Logo, α é necessariamente nulo. Portanto, S é LI.
Propriedade P2. Se V é espaço vetorial, S = {u} ⊂ V com u 6= 0, então S é LI.
Justificativa: Seja α ∈ R tal que αu = 0. Logo, α = 0 necessariamente (pois u 6= 0).
De fato, se α 6= 0 teŕıamos a existência de α−1 ∈ R tal que αα−1 = 1. Além disso, α−10 = α−1 (0+ 0) =
α−10+ α−10 e, portanto,
0 = −
(
α−10
)
+
(
α−10
)
= −
(
α−10
)
+
(
α−10+ α−10
)
=
(
−α−10+ α−10
)
+ α−10 = 0+ α−10 = α−10.
Logo,
αu = 0⇒ α−1 (αu) = α−10⇒ (αα−1)u = 0⇒ 1u = 0⇒ u = 0,
uma contradição com a hipótese.
• (3) Quando S ⊂ V, sendo V espaço vetorial, é finito e LD, é verdade que existe um elemento de S que pode ser
escrito como combinação linear dos demais?
Exemplo: V = R2 e S = {(1, 0) , (0, 1) , (1, 1)} é LD, pois 1 (1, 0) + 1 (0, 1) − 1 (1, 1) = (0, 0) e α1 = 1, α2 = 1,
α3 = −1 não são todos nulos.
Podemos escrever (1, 0) como combinação linear de (0, 1) e (1, 1) do seguinte modo: (1, 0) = 1 (1, 1) − 1 (0, 1).
Idem para (0, 1) sendo (0, 1) = 1 (1, 1) − 1 (1, 0).
Idem para (1, 1) sendo (1, 1) = 1 (1, 0) + 1 (0, 1).
Propriedade P3. Se S = {u1, . . . , un} ⊂ V, sendo V espaço vetorial, é LD, então existe um de seus elementos que
pode ser escrito como combinação linear dos demais.
Justificativa: Como S é LD, existem α1, . . . , αn ∈ R tais que α1u1 + · · · + αnun = 0 com algum αk 6= 0. Logo,
existe α−1k ∈ R tal que αkα
−1
k = 1 e
α−1k (α1u1 + · · ·+ αnun) = α
−1
k 0⇒ (α1α−1k )u1 + · · ·+ (αkα−1k )uk + · · ·+ (αnα−1k )un = 0⇒
uk = −
(
α1α
−1
k
)
u1 − · · ·−
(
αk−1α
−1
k
)
uk−1 −
(
αk+1α
−1
k
)
uk+1 − · · ·−
(
αnα
−1
k
)
un,
ou seja, uk é combinação linear dos demais elementos de S.
Uma observação importante sobre a propriedade (3): nem sempre todo elemento de S pode ser escrito como combinação
linear dos demais elementos de S, como fizemos no exemplo acima. De fato, S = {(1, 0) , (2, 0) , (0, 1)} é LD, pois
2 (1, 0) − 1 (2, 0) + 0 (0, 1) = (0, 0). Mas (0, 1) não pode ser escrito como combinação linear de (1, 0) e (2, 0), pois caso
contrário, (0, 1) = α1 (1, 0) + α2 (2, 0)⇒ { α1 + 2α2 = 01 = 0 , o que é uma contradição.
• (4) Quando S1 e S2 são finitos e não vazios com S1 LD e S1 ⊂ S2 ⊂ V, sendo V espaço vetorial, o conjunto S2 é LI
ou LD?
Exemplo: S2 = {(1, 0) , (0, 1) , (1, 1) , (2, 0)} e S1 = {(1, 0) , (2, 0)} são tais que S1 é LD, pois 1 (1, 0)−
1
2
(2, 0) = (0, 0)
e α1 = 1, α2 = −
1
2
não são nulos. Mas S2 também é LD, pois 1 (1, 0) −
1
2
(2, 0) + 0 (0, 1) + 0 (1, 1) = (0, 0).
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 300 de 351 páginas UFU GAAL
Propriedade P4. Se S1 ⊂ S2 são conjuntos finitos não vazios no espaço vetorial V e S1 é LD, então S2 é LD.
Justificativa: Tomemos S1 = {u1, . . . , ur} e S2 = {u1, . . . , ur, . . . , un}. Como S1 é LD, existem α1, . . . , αr ∈ R
não todos nulos tais que α1u1 + · · · + αrur = 0 ⇒ α1u1 + · · · + αrur + 0ur+1 + · · · + 0un = 0, ou seja, existem
α1, . . . , αr, . . . , αn ∈ R não todos nulos tais que α1u1 + · · ·+ αrur + · · ·+ αnun = 0 e, portanto, S2 é LD.
• (5) Um conjunto finito não vazio contido em um conjunto finito LI em um espaço vetorial pode ser LD?
Exemplo: Seja S1 = {(1, 0, 0) , (1, 1, 0)} e S2 = {(1, 0, 0) , (1, 1, 0) , (1, 1, 1)}.
O conjunto S2 é LI pois α1 (1, 0, 0)+α2 (1, 1, 0)+α3 (1, 1, 1) = (0, 0, 0)⇒ (α1 + α2 + α3, α2 + α3, α3) = (0, 0, 0)⇒
α1 = α2 = α3 = 0 (necessariamente)
O conjunto S1 é LI pois α1 (1, 0, 0) + α2 (1, 1, 0) = (0, 0, 0) ⇒ (α1 + α2, α2, 0) = (0, 0, 0) ⇒ α1 = α2 = 0
(necessariamente).
Propriedade P5. Se S1 ⊂ S2 são conjuntos finitos não vazios no espaço vetorial V e S2 é LI, então S1 é LI.
Justificativa: se S1 fosse LD, então pela propriedade (4), S2 seria LD, uma contradição com a hipótese. Logo, S1
é LI.
• (6) Se adicionarmos um elemento a um conjunto LI e este novo conjunto tornar-se LD, podemos escrever u como
combinação linear dos elementos do conjunto original?
Exemplo: S = {(1, 0) , (0, 1)} é LI. Tomemos u = (10, 20) e formemos o conjunto S′ = {(1, 0) , (0, 1) , (10, 20)} que
é LD, pois 10 (1, 0) + 20 (0, 1) − 1 (10, 20) = (0, 0) com coeficientes α1 = 10, α2 = 20 e α3 = −1 não todos nulos. O
elemento (10, 20) pode ser escrito como combinação linear de (1, 0) e (0, 1). De fato, (10, 20) = 10 (1, 0) + 20 (0, 1).
Propriedade P6. Se S = {u1, . . . , un} ⊂ V, sendo V espaço vetorial, é LI e S′ = S ∪ {u} é LD com u ∈ V, então
u é combinação linear dos elementos de S.
Justificativa: Por hipótese, S′ é LD. Logo, existem α1, . . . , αn, α ∈ R não todos nulos tais que α1u1+ · · ·+αnun+
αu = 0.
Afirmação: α 6= 0. De fato, se α = 0 teŕıamos α1u1 + · · · + αnun = 0 e, como S é LI por hipótese, teŕıamos
α1 = · · · = αn = 0, contrariando o fato de α1, . . . , αn, α não serem todos nulos.
Logo, existe α−1 ∈ R tal que αα−1 = 1. Portanto,
α−1 (α1u1 + · · ·+ αnun + αu) = α−10⇒ (α−1α1)u1 + · · ·+ (α−1αn)un + (α−1α)u = 0⇒
u = −
(
α−1α1
)
u1 − · · ·−
(
α−1αn
)
un,
ou seja, u pode ser escrito como combinação linear dos elementos de S. Em outras palavras, u ∈ [S].
• (7) Seja S um conjunto finito e não vazio e suponhamos que u ∈ S possa ser escrito como combinação linear dos
demais elementos de S. Nessas condições, é verdade que os espaços vetoriais gerados por S e por S−{u} são os mesmos?
Em outras palavras, [S] = [S− {u}]?
Exemplo: Seja S = {(1, 0) , (0, 1) , (1, 1)} e u = (1, 1). Temos u como combinação linear de (1, 0) e (0, 1), pois
(1, 1) = 1 (1, 0) + 1 (0, 1) com α1 = 1 e α2 = 1 não nulos.
Nessas condições, [S] = {x (1, 0) + y (0, 1) + z (1, 1) : x, y, z ∈ R} e [S− {u}] = {x′ (1, 0) + y′ (0, 1) : x′, y′ ∈ R}.
É óbvio que [S− {u}] ⊂ [S] (basta fazer z = 0 em [S]).
Quanto à inclusão contrária, seja v ∈ [S] ⇒ v = x (1, 0) + y (0, 1) + z (1, 1) ∈ [S] ⇒ v = x (1, 0) + y (0, 1) +
z ((1, 0) + (0, 1)) = (x+ z)︸ ︷︷ ︸
x′
(1, 0)+ (y+ z)︸ ︷︷ ︸
y′
(0, 1) = x′ (1, 0) + y′ (0, 1)⇒ v ∈ [S− {u}]. Logo, [S] ⊂ [S− {u}].
Portanto, [S] = [S− {u}].
Propriedade P7. Se S = {u1, . . . , uk, . . . , un} ⊂ V, sendo V espaço vetorial, e uk ∈ [S− {uk}], então [S] =
[S− {uk}].
Justificativa: Como S− {uk} ⊂ S⇒ [S− {uk}] ⊂ [S] (propriedade).
Quanto à inclusão contrária, seja v ∈ [S] ⇒ v = α1u1 + · · · + αkuk + · · · + αnun. Como uk ∈ [S− {uk}] ⇒ uk =
β1u1 + · · ·+ βk−1uk−1 + βk+1uk+1 + · · ·+ βnun.
Portanto,
v = α1u1 + · · ·+ αkuk + · · ·+ αnun
= α1u1 + · · ·+ αk (β1u1 + · · ·+ βk−1uk−1 + βk+1uk+1 + · · ·+ βnun) + · · ·+ αnun
= (α1 + αkβ1)u1 + · · ·+ (αk−1 + αkβk−1)uk−1 + (αk+1 + αkβk+1)uk+1 + · · ·+ (αn + αkβn)un,
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 301 de 351 páginas
ou seja, v ∈ [S− {uk}]. Portanto, [S] ⊂ [S− {uk}].
Conclusão: [S] = [S− {uk}].
Propriedade P8. Se S ⊂ V é finito, não vazio e LI, sendo V espaço vetorial, então v ∈ [S] é escrito de maneira
única como combinação linear dos elementos de S.
Justificativa: Suponhamos que S = {u1, . . . , un} e v ∈ [S] é tal que v = α1u1+ · · ·+αnun e v = β1u1+ · · ·+βnun.
Então:
α1u1 + · · ·+ αnun = β1u1 + · · ·+ βnun ⇒ (α1 − β1)u1 + · · ·+ (αn − βn)un = 0⇒
α1 − β1 = · · · = αn − βn = 0 (pois S é LI)⇒α1 = β1, . . . , αn = βn,
ou seja v é escrito de modo único como combinação linear dos elementos de S.
7.5 Base e Dimensão
Chegou o momento de juntarmos os conceitos apresentados nas duas últimas seções: conjunto gerador e conjunto LI
na definição abaixo.
Seja V um espaço vetorial real finitamente gerado. Um subconjunto B ⊂ V finito é uma base de V quando:
(i) B é um conjunto LI;
(ii) B gera V, ou seja, [B] = V.
Quando V = {0}, convencionamos que B = ∅ é base de V.
Exemplo 7.35 B = {(1, 0) , (0, 1)} é uma base de R2.
De fato:
(i) Sejam α1, α2 ∈ R tais que α1 (1, 0) + α2 (0, 1) = (0, 0)⇒ (α1, α2) = (0, 0)⇒ α1 = α2 = 0. Logo, B é LI.
(ii) Obviamente [B] ⊂ R2. Quanto à inclusão contrária, seja (x, y) ∈ R2 ⇒ (x, y) = x (1, 0) + y (0, 1) ⇒ (x, y) ∈ [B].
Logo, R2 ⊂ [B]. Portanto, R2 = [B].
Observemos que este exemplo pode ser facilmente generalizado: B = {(1, 0, . . . , 0) , (0, 1, . . . , 0) , . . . , (0, 0, . . . , 1)} é
uma base para Rn, chamada de base canônica de Rn.
Exemplo 7.36 C = {(1, 1) , (2, 3)} é uma base de R2.
De fato:
(i) Sejam α1, α2 ∈ R tais que α1 (1, 1) + α2 (2, 3) = (0, 0) ⇒ (α1 + 2α2, α1 + 3α2) = (0, 0) ⇒ { α1 + 2α2 = 0α1 + 3α2 = 0 ⇒
α1 = α2 = 0. Logo, C é LI.
(ii) Obviamente [C] ⊂ R2. Quanto à inclusão contrária, sejam (x, y) ∈ R2 e α1, α2 ∈ R tais que
(x, y) = β1 (1, 1) + β2 (2, 3)⇒ (x, y) = (β1 + 2β2, β1 + 3β2)⇒ { β1 + 2β2 = xβ1 + 3β2 = y ⇒
{
β1 + 2β2 = x
β2 = y− x
.
Portanto, β2 = y− x e β1 = x− 2 (y− x) = 3x− 2y. Desta forma, (x, y) = (3x− 2y) (1, 1)+ (y− x) (2, 3), ou seja,
(x, y) ∈ [C]. Logo, R2 ⊂ [C].
Portanto, R2 = [C].
Observação: Os Exemplos 7.35 e 7.36 já nos conferem uma informação importante: bases não são únicas para um
mesmo espaço vetorial. Nesses exemplos, tanto B = {(1, 0) , (0, 1)} quanto C = {(1, 1) , (2, 3)} são bases de R2.
Exemplo 7.37 B =
{
1, x, x2, . . . , xn
}
é base de Pn (R), chamada de base canônica de Pn (R).
De fato:
(i) Sejam α0, . . . , αn ∈ R tais que α01 + α1x + α2x2 + · · · + αnxn = 0 (0 é o polinômio nulo) ⇒ α0 = · · · = αn = 0.
Logo, B é LI.
(ii) Obviamente [B] ⊂ Pn (R). Quanto à inclusão contrária, seja p = a0+a1x+a2x2+ · · ·+anxn ∈ Pn (R)⇒ p ∈ [B]
pois α0 = a0, α1 = a1, . . ., αn = an na combinação linear dos elementos de B. Logo, Pn (R) ⊂ [B]. Portanto,
Pn (R) = [B].
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 302 de 351 páginas UFU GAAL
Exemplo 7.38 B =
{ï
1 0
0 0
ò
,
ï
0 1
0 0
ò
,
ï
0 0
1 0
ò
,
ï
0 0
0 1
ò}
é base de M2 (R).
De fato:
(i) Sejam α1, . . . , α4 ∈ R tais que
α1
ï
1 0
0 0
ò
+ α2
ï
0 1
0 0
ò
+ α3
ï
0 0
1 0
ò
+ α4
ï
0 0
0 1
ò
=
ï
0 0
0 0
ò⇒ ïα1 α2
α3 α4
ò
=
ï
0 0
0 0
ò⇒ α1 = · · · = α4 = 0.
Logo, B é LI.
(ii) Obviamente [B] ⊂M2 (R). Quanto à inclusão contrária, sejaï
a b
c d
ò
∈M2 (R)⇒ ïa bc dò = a ï1 00 0ò+ b ï0 10 0ò+ c ï0 01 0ò+ d ï0 00 1ò⇒ ïa bc dò ∈ [B] .
Logo, M2 (R) ⊂ [B]. Portanto, M2 (R) = [B].
Observemos que esse exemplo pode ser generalizado para Mm×n (R) tomando
B =

1 0 0 · · · 0... ...
0 0 0 · · · 0

m×n
,
0 1 0 · · · 0... ...
0 0 0 · · · 0

m×n
, . . . ,
0 0 0 · · · 0... ...
0 0 0 · · · 1

m×n
 ,
chamada de base canônica de Mmxn (R).
Observação importante.
Se B = {u1, . . . , un} é base de V, então v = α1u1+ · · ·+αnun ∈ V é escrito como combinação linear dos elementos
de B de forma única a menos de comutação dos termos, isto é, se além desta combinação linear para v, também
tivermos v = β1u1 + · · ·+ βnun, então α1 = β1, . . ., αn = βn.
De fato, da igualdade α1u1 + · · · + αnun = β1u1 + · · · + βnun temos (α1 − β1)u1 + · · · + (αn − βn)un = 0 ⇒
α1 − β1 = · · · = αn − βn = 0 (pois B é base e, portanto, LI). Logo, α1 = β1, . . ., αn = βn.
Assim, conclúımos que, embora um espaço vetorial possa ter diversas bases, uma vez fixada uma delas, a maneira
de escrever cada elemento do espaço vetorial como combinação linear dos elementos da base é única.
Proposição 7.9 (Teorema da Existência de Base) Todo espaço vetorial real finitamente gerado admite uma base.
Demonstração da Proposição 7.9.
Se V = {0}, então B = ∅ é base para V.
Se V 6= {0}, então existe S ⊂ V finito tal que [S] = V (pois V é finitamente gerado). Naturalmente, S 6= {0}.
Como S 6= {0}, existem subconjuntos de S que são LI. Tome B ⊂ S como sendo um desses subconjuntos LI com
o maior número posśıvel de elementos.
Afirmação: B é base de V. De fato:
(i) B é LI por construção.
(ii) Seja S− B = {u1, . . . , ur}. Tomemos u1 ∈ S− B. Temos que B ∪ {u1} é LD (pelo modo como B foi constrúıdo).
Por propriedade, u1 é combinação linear de elementos de B. De modo análogo para u2, . . . , ur.
Também por propriedade: [B] = [B ∪ {u1}] = [B ∪ {u1, u2}] = · · · = [B ∪ {u1, . . . , ur}] = [(S− B) ∪ B] = [S] = V,
como queŕıamos. �
Proposição 7.10 (Teorema da Invariância) Duas bases quaisquer de um espaço vetorial real finitamente gerado possui
o mesmo número de elementos.
O Teorema da Invariância motiva a seguinte definição:
Seja V um espaço vetorial real finitamente gerado. Denomina-se dimensão de V (notação: dimV) o número
de elementos de uma base qualquer de V.
Exemplo 7.39 Analisando os Exemplos 7.35, 7.37 e 7.38 anteriores temos: dimR2 = 2, dimRn = n, dimPn (R) =
n+ 1, dimMm×n (R) = mn e dim {0} = 0.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 303 de 351 páginas
Proposição 7.11 (Teorema do Completamento de Base) Sejam V espaço vetorial real finitamente gerado, dimV =
n ≥ 1 e S = {u1, . . . , ur} ⊂ V linearmente independente com r < n. Então, existem ur+1, . . . , un ∈ V tais que
{u1, . . . , ur, ur+1, . . . , un} é uma base de V.
Proposição 7.12 Seja U subespaço vetorial de um espaço vetorial real finitamente gerado V. Se dimU = dimV, então
U = V.
Demonstração da Proposição 7.12.
Se U é subespaço vetorial de V, então U é finitamente gerado (Proposição 7.8, página 297). Logo, U tem uma
base finita B que também serve como base para V, pois dimU = dimV. Logo, temos dois espaços vetoriais U e V
com a mesma base.
Portanto, U = V. �
Exemplo 7.40 Mostremos que B =
{ï
1 1
0 0
ò
,
ï
2 1
0 0
ò
,
ï
1 0
0 1
ò
,
ï
0 0
1 2
ò}
forma uma base para M2 (R) usando a Pro-
posição 7.12 acima.
De fato:
(i) Sejam α1, . . . , α4 ∈ R tais que
α1
ï
1 1
0 0
ò
+α2
ï
2 1
0 0
ò
+α3
ï
1 0
0 1
ò
+α4
ï
0 0
1 2
ò
=
ï
0 0
0 0
ò⇒ S =  α1 + 2α2 + α3 = 0α1 + α2 = 0α4 = 0
α3 + 2α4 = 0
⇒ α1 = · · · = α4 = 0.
Logo, B é um conjunto LI.
(ii) Sabemos que dimM2 (R) = 4. Como o espaço vetorial U = [B] gerado pelas matrizes de B possui dimensão 4 e é
um subespaço vetorial de M2 (R), então, pela Proposição 7.12 acima, [B] = M2 (R) e, portanto, B é uma base para
M2 (R).
Notemos que a Proposição 7.12 acima nos poupa de provar que M2 (R) ⊂ [B].
A próxima proposição fornece um modo de construir bases a partir de uma base fornecida utilizando matrizes
quadradas invert́ıveis.
Proposição 7.13 Se B = {u1, . . . , un} é uma base para o espaço vetorial real V e M = [aij]n×n é uma matriz n × n
invert́ıvel, então C = {v1, . . . , vn} tal que
vj =
n∑
i=1
aijui
é uma base de V.
Observação: Para facilitar a memorização da Proposição 7.13 acima, podemos escreverv1...
vn
 =Mt
u1...
un
 =
a11 · · · an1... ...
a1n · · · ann

u1...
un

embora ui e vj não sejam, necessariamente, números.
Exemplo 7.41 Sejam B = {(1, 1) , (1, 2)} base de R2 e M =
ï
1 2
1 1
ò
∈M2 (R) matriz invert́ıvel. Logo, pela Proposição
7.13 acima:
v1 =
2∑
i=1
ai1ui = 1 (1, 1) + 1 (1, 2) = (2, 3) ;
v2 =
2∑
i=1
ai2ui = 2 (1, 1) + 1 (1, 2) = (3, 4) .
e C = {(2, 3) , (3, 4)} é base de R2.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 304 de 351 páginas UFU GAAL
Processo Prático para Determinar uma Basede um Subespaço Vetorial de Rn
Seja V = [u1, . . . , um] ⊂ Rn subespaço vetorial. As propriedades abaixo são de fácil demonstração:
Propriedade 1.
î
u1, . . . , ui, . . . , uj, . . . , um
ó
=
î
u1, . . . , uj, . . . , ui, . . . , um
ó
(comutação de dois elementos);
Propriedade 2.
[
u1, . . . , ui, . . . , um
]
=
[
u1, . . . , αui, . . . , um
]
, α 6= 0 (multiplicação de elemento por escalar não
nulo);
Propriedade 3.
î
u1, . . . , ui, . . . , uj, . . . , um
ó
=
î
u1, . . . , ui, . . . , αui + uj, . . . , um
ó
(adição de elemento multipli-
cado por escalar a outro elemento);
Propriedade 4. Tomando a matriz m × n cujas linhas são formadas pelas coordenadas dos elementos uk e
escalonando-a, as linhas não nulas da matriz escalonada dão origem a um conjunto LI que serve de base para V.
Exemplo 7.42 Seja V = [(1, 1, 0, 2) , (2, 1, 3, 0) , (1, 1, 1, 1) , (0, 2, 1, 1)] ⊂ R4 subespaço vetorial.
Vamos determinar uma base de V.
Consideremos a matriz formada pelos geradores de V e escalonemo-a:
1 1 0 2
2 1 3 0
1 1 1 1
0 2 1 1

.(-2)�
+
.(-1)
�
+
∼=
∗

1 1 0 2
0 −1 3 −4
0 0 1 −1
0 2 1 1
 .(2)
�
+
∼=
∗∗

1 1 0 2
0 −1 3 −4
0 0 1 −1
0 0 7 −7
 .(-7)�
+
∼=
∗∗∗

1 1 0 2
0 −1 3 −4
0 0 1 −1
0 0 0 0

∗ aqui usamos a Propriedade 3 substituindo u2 por −2u1 + u2 e substituindo u3 por −1u1 + u3.
Logo, V = [(1, 1, 0, 2) , (0,−1, 3,−4) , (0, 0, 1,−1) , (0, 2, 1, 1)].
∗∗ aqui usamos a Propriedade 3 substituindo u4 por −2u2 + u4.
Logo, V = [(1, 1, 0, 2) , (0,−1, 3,−4) , (0, 0, 1,−1) , (0, 0,−7, 7)].
∗∗∗ aqui usamos a Propriedade 3 substituindo u4 por −7u3 + u4.
Logo, V = [(1, 1, 0, 2) , (0,−1, 3,−4) , (0, 0, 1,−1) , (0, 0, 0, 0)] = [(1, 1, 0, 2) , (0,−1, 3,−4) , (0, 0, 1,−1)].
Conclusão: pela Propriedade 4, B = {(1, 1, 0, 2) , (0,−1, 3,−4) , (0, 0, 1,−1)} é base de V e, portanto, V possui
dimensão 3.
Exemplo 7.43 Determinemos uma base de U+ V sendo
U =
{
(x, y, z) ∈ R3 : x+ z = 0
}
V =
{
(x, y, z) ∈ R3 : x = y
}
Temos U =
{
(x, y,−x) ∈ R3
}
=
{
x (1, 0,−1) + y (0, 1, 0) ∈ R3
}
. Logo, U = [(1, 0,−1) , (0, 1, 0)].
Temos V =
{
(x, x, z) ∈ R3
}
=
{
x (1, 1, 0) + z (0, 0, 1) ∈ R3
}
. Logo, V = [(1, 1, 0) , (0, 0, 1)].
Portanto, U+ V = [(1, 0,−1) , (0, 1, 0) , (1, 1, 0) , (0, 0, 1)].
Encontrando uma base para U+ V:
1 0 −1
0 1 0
1 1 0
0 0 1

.(-1)
�
+
∼=

1 0 −1
0 1 0
0 1 1
0 0 1
 .(-1)�+ ∼=

1 0 −1
0 1 0
0 0 1
0 0 1
 .(-1)�
+
∼=

1 0 −1
0 1 0
0 0 1
0 0 0

Logo, U+ V = [(1, 0,−1) , (0, 1, 0) , (0, 0, 1)], B = {(1, 0,−1) , (0, 1, 0) , (0, 0, 1)} é base de U+ V e dimU+ V = 3.
Exemplo 7.44 Determinemos uma base do espaço vetorial R4 que contenha u1 = (1, 2,−1, 2) e u2 = (1, 3,−1, 3).
Como dimR4 = 4, então uma base de R4 deve possuir 4 elementos. Temosï
1 2 −1 2
1 3 −1 3
ò
.(-1)�
+
∼=
ï
1 2 −1 2
0 1 0 1
ò
,
ou seja, [u1, u2] = [u1, (0, 1, 0, 1)] e, portanto, {u1, u2} é LI.
Utilizando o Teorema do Completamento de Base (Proposição 7.11, página 303):
1 2 −1 2
0 1 0 1
0 0 1 0
0 0 0 1

permite que concluamos que B′ = {(1, 2,−1, 2) , (0, 1, 0, 1) , (0, 0, 1, 0) , (0, 0, 0, 1)} é base de R4 e, como [u1, u2] =
[u1, (0, 1, 0, 1)], temos B = {(1, 2,−1, 2) , (1, 3,−1, 3) , (0, 0, 1, 0) , (0, 0, 0, 1)}.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 305 de 351 páginas
Dimensão da Soma de Dois Subespaços Vetoriais
Proposição 7.14 Sejam V espaço vetorial real finitamente gerado, U e W subespaços vetoriais de V. Então,
dim (U+W) = dimU+ dimW − dim (U ∩W) .
Exemplo 7.45 Consideremos os seguintes subespaços de R4:
U = [(1, 0, 1, 0) , (0, 1, 0, 0)] e W = {(x, y, z, t) : x+ y = 0} .
Determinemos dim (U ∩W) e dim (U+W).
O conjunto B1 = {(1, 0, 1, 0) , (0, 1, 0, 0)} é LI e gera U. Logo, B1 é base de U e, portanto, dimU = 2.
Quanto a W:
W = {(x, y, z, t) : x+ y = 0} = {(−y, y, z, t)} = {y (−1, 1, 0, 0) + z (0, 0, 1, 0) + t (0, 0, 0, 1)}
= [(−1, 1, 0, 0) , (0, 0, 1, 0) , (0, 0, 0, 1)] .
O conjunto B2 = {(−1, 1, 0, 0) , (0, 0, 1, 0) , (0, 0, 0, 1)} é LI e gera W. Logo, B2 é base de W e, portanto, dimW = 3.
Temos U+W = [(1, 0, 1, 0) , (0, 1, 0, 0) , (−1, 1, 0, 0) , (0, 0, 1, 0) , (0, 0, 0, 1)]. Vamos encontrar uma base para U+W:
1 0 1 0
0 1 0 0
−1 1 0 0
0 0 1 0
0 0 0 1

.(1)
�
+ ∼=

1 0 1 0
0 1 0 0
0 1 1 0
0 0 1 0
0 0 0 1

.(-1)�
+ ∼=

1 0 1 0
0 1 0 0
0 0 1 0
0 0 1 0
0 0 0 1
 .(-1)�+ ∼=

1 0 1 0
0 1 0 0
0 0 1 0
0 0 0 0
0 0 0 1

Logo, B3 = {(1, 0, 1, 0) , (0, 1, 0, 0) , (0, 0, 1, 0) , (0, 0, 0, 1)} é base de U+W. Portanto, dim (U+W) = 4.
Observemos que U+W ⊂ R4 e dim (U+W) = dimR4 = 4. Logo, U+W = R4 (Proposição 7.12, página 303).
Pela Proposição 7.14 acima temos dim (U+W) = dimU + dimW − dim (U ∩W) ⇒ 4 = 2 + 3 − dim (U ∩W) ⇒
dim (U ∩W) = 1.
Exemplo 7.46 Sejam U e W subespaços vetoriais de R4 tais que dimU = dimW = 3.
Se U ∩W = [(1, 2, 1, 0) , (−1, 1, 0, 1) , (1, 5, 2, 1)], determinemos a dimensão de U+W.
Para começar, determinemos uma base de U ∩W: 1 2 1 0−1 1 0 1
1 5 2 1
 .(1)�+ .(-1)�
+
∼=
1 2 1 00 3 1 1
0 3 1 1
 .(1)�
+
∼=
1 2 1 00 3 1 1
0 0 0 0

Temos U ∩W = [(1, 2, 1, 1) , (0, 3, 1, 1)] e B = {(1, 2, 1, 1) , (0, 3, 1, 1)} é base de U ∩W. Portanto, dimU ∩W = 2.
Pela Proposição 7.14 acima, dim (U+W) = dimU+ dimW − dim (U ∩W)⇒ dim (U+W) = 3+ 3− 2 = 4.
Exemplo 7.47 Determinemos uma base e a dimensão do subespaço vetorial formado pelas soluções do sistema linear
homogêneo
S =
 x − y − z − t = 02x + y + t = 0
z − t = 0
.
Escalonando:
S =
 x − y − z − t = 0 .(-2)2x + y + t = 0 �+
z − t = 0
∼ S′ =
 x − y − z − t = 03y + 2z + 3t = 0
z − t = 0
A terceira linha nos fornece z = t que, substituindo na segunda linha, nos fornece y = −5
3
t que, substituindo na
primeira linha, nos fornece x = t
3
.
Desta forma, U =
{(
t
3
,−5
3
t, t, t
)
: t ∈ R
}
=
{
t
(
1
3
,−5
3
, 1, 1
)
: t ∈ R
}
=
[(
1
3
,−5
3
, 1, 1
)]
é o subespaço vetorial de R4
formado pelas soluções do sistema. Logo, B =
{(
1
3
,−5
3
, 1, 1
)}
é base de U e, portanto, dimU = 1.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 306 de 351 páginas UFU GAAL
Coordenadas de Elemento de Espaço Vetorial
Bases permitem que possamos definir coordenadas para elementos de espaços vetoriais, conforme veremos abaixo.
Seja B uma base de um espaço vetorial V.
Dizemos que a base B está ordenada quando fixamos a posição de cada elemento de B, ou seja, em B identifi-
camos qual é o primeiro elemento, o segundo elemento, e assim por diante.
Por exemplo, B = {(1, 0, 0) , (0, 1, 0) , (0, 0, 1)} é base ordenada de R3, quando consideramos (1, 0, 0) como o primeiro
elemento, (0, 1, 0) o segundo elemento e (0, 0, 1) o terceiro elemento.
Lembremos que se B = {u1, . . . , un} é base de V, então v = α1u1 + · · · + αnun ∈ V é escrito como combinação
linear dos elementos de B de forma única a menos de comutação dos termos.
Quando a base B de um espaço vetorial V é ordenada, a ordem dos coeficientes αi na combinação linear que
representa v ∈ V permite que associemos uma única n-upla ao elemento v, conforme definição abaixo:
Sejam B = {u1, . . . , un} base ordenada do espaço vetorial real V e v = α1u1 + · · ·+ αnun ∈ V.
Dizemos que α1, . . . , αn são as coordenadas de v em relação à base B e escrevemos v = (α1, . . . , αn)B.
Exemplo 7.48 Seja B =
{
1, 1+ x, 1+ x2
}
base ordenada de P2 (R). Determinemos as coordenadas de
p = 2+ 4x+ x2 ∈ P2 (R).
Temos
p = α1 (1) + α2 (1+ x) + α3
(
1+ x2
)⇒ 2+ 4x+ x2 = α1 (1) + α2 (1+ x) + α3 (1+ x2)⇒
2+ 4x+ x2 = (α1 + α2 + α3) + α2x+ α3x
2 ⇒ α3 = 1, α2 = 4, α1 = −3.
Logo, com os coeficientes α1, α2 e α3 da combinação linear de p podemos escrever (α1, α2, α3)B = (−3, 4, 1)B
como sendo a única terna associada a p na base ordenada B.
Escrevemos p = (−3, 4, 1)B.
Exemplo 7.49 Sejam B1 = {(1, 0, 0) , (0, 1, 0) ,(0, 0, 1)} e B2 = {(1, 0, 0) , (1, 1, 0) , (1, 1, 1)} bases ordenadas de R3.
Determinemos as coordenadas de v = (1,−1, 3) ∈ R3 nas bases B1 e B2.
Quanto a B1 temos:
v = (1,−1, 3) = 1 (1, 0, 0) − 1 (0, 1, 0) + 3 (0, 0, 1)⇒ v = (1,−1, 3)B1 .
Notemos que na base canônica de R3 as coordenadas “originais” de v as coordenadas de v na base canônica
coincidem.
Quanto a B2 temos:
v = (1,−1, 3) = α1 (1, 0, 0) + α2 (1, 1, 0) + α3 (1, 1, 1)⇒ (1,−1, 3) = (α1 + α2 + α3, α2 + α3, α3)⇒
α3 = 3, α2 = −4 e α1 = 2⇒ v = (2,−4, 3)B2 .
Já, quando a base não é canônica, as coordenadas “originais” de v não coincidem com as coordenadas de v na tal base.
Exemplo 7.50 Determinemos v ∈ R3, sendo B = {(1,−1, 1) , (0, 1, 2) , (1, 0, 3)} base ordenada de R3 e v = (2,−1, 0)B.
Temos, a partir de v = (2,−1, 0)B, que v = 2 (1,−1, 1) − 1 (0, 1, 2) + 0 (1, 0, 3) = (2− 0+ 0,−2− 1, 2− 2+ 0) =
(2,−3, 0), ou seja, v = (2,−3, 0) ∈ R3.
Mudança de Base
Podemos relacionar coordenadas de um mesmo elemento de um espaço vetorial escritas em duas bases diferentes.
Para tanto, precisamos do conceito de mudança de base, dado pela definição abaixo.
Sejam B = {u1, . . . , un} e C = {v1, . . . , vn} bases ordenadas do espaço vetorial real V. Podemos escrever
v1 = α11u1 + · · ·+ αn1un
v2 = α12u1 + · · ·+ αn2un
...
vn = α1nu1 + · · ·+ αnnun
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 307 de 351 páginas
Chamamos a matriz
MB,C =

α11 α12 · · · α1n
α21 α22 · · · α2n
...
...
αn1 αn2 · · · αnn

B,C
de matriz de mudança de bases, da base B para a base C.
Exemplo 7.51 Sejam B = {(1, 1) , (2, 3)} e C = {(1, 0) , (1, 2)} bases do R2. Determinemos as matrizes de mudança de
bases de B para C e de C para B.
De B para C:
(1, 0) = α11 (1, 1) + α21 (2, 3)⇒ (1, 0) = (α11 + 2α21, α11 + 3α21)⇒ { α11 + 2α21 = 1α11 + 3α21 = 0 ⇒ α11 = 3 e α21 = −1.
(1, 2) = α12 (1, 1) + α22 (2, 3)⇒ (1, 2) = (α12 + 2α22, α12 + 3α22)⇒ { α12 + 2α22 = 1α12 + 3α22 = 2 ⇒ α12 = −1 e α22 = 1.
Logo,
MB,C =
ï
3 −1
−1 1
ò
B,C
.
De C para B:
(1, 1) = α11 (1, 0) + α21 (1, 2)⇒ (1, 1) = (α11 + α21, 2α21)⇒ { α11 + α21 = 12α21 = 1 ⇒ α11 = 12 e α21 = 12 .
(2, 3) = α12 (1, 0) + α22 (1, 2)⇒ (2, 3) = (α12 + α22, 2α22)⇒ { α12 + α22 = 22α22 = 3 ⇒ α12 = 12 e α22 = 32 .
Logo,
MC,B =
ï
1/2 1/2
1/2 3/2
ò
C,B
.
Exemplo 7.52 Sejam B =
{
3, 1− x, 1+ x2
}
e C =
{
1, 1+ x, 1+ x+ x2
}
bases do P2 (R). Determinemos a matriz de
mudança de bases de B para C.
Temos
1 = α113+ α21 (1− x) + α31
(
1+ x2
)⇒ 1 = (α11 + α21 + α31) − α21x+ α31x2 ⇒ 3α11 + α21 + α31 = 1− α21 = 0
α31 = 0
⇒ α11 = 13 , α21 = 0 e α31 = 0.
1+ x = α123+ α22 (1− x) + α32
(
1+ x2
)⇒ 1+ x = (α12 + α22 + α32) − α22x+ α32x2 ⇒ 3α12 + α22 + α32 = 1− α22 = 1
α32 = 0
⇒ α12 = 23 , α22 = −1 e α32 = 0.
1+ x+ x2 = α133+ α23 (1− x) + α33
(
1+ x2
)⇒ 1+ x+ x2 = (α13 + α23 + α33) − α23x+ α33x2 ⇒ 3α13 + α23 + α33 = 1− α23 = 1
α33 = 1
⇒ α13 = 13 , α23 = −1 e α33 = 1.
Logo,
MB,C =
1/3 2/3 1/30 −1 −1
0 0 1

B,C
.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 308 de 351 páginas UFU GAAL
Observação: Se B é base ordenada do espaço vetorial V de dimensão n, então MB,B = Idn.
De fato, se B = {u1, . . . , un}, então 
u1 = 1u1 + 0u2 + · · ·+ 0un
u2 = 0u1 + 1u2 + · · ·+ 0un
...
un = 0u1 + 0u2 + · · ·+ 1un
Logo,
MB,B =

1 0 · · · 0
0 1 · · · 0
...
...
0 0 · · · 1

B,B
= Idn .
Proposição 7.15 Sejam B, C e D bases ordenadas do espaço vetorial real V e MB,C e MC,D matrizes de mudança de
bases de B para C e de C para D, respectivamente. Então,
MB,D =MB,C.MC,D .
Proposição 7.16 Toda matriz de mudança de bases é invert́ıvel e, sendo B e C bases ordenadas de V, então
MB,C =M
−1
C,B .
Demonstração da Proposição 7.16.
Sejam B e C bases ordenadas do espaço vetorial V.
Pela Proposição 7.15 acima, MB,C.MC,B =MB,B = Id.
Analogamente, MC,B.MB,C =MC,C = Id.
Portanto, MB,C.MC,B = MC,B.MB,C = Id ⇒ MB,C = M−1C,B e MC,B = M−1B,C, ou seja, as matrizes MB,C e
MC,B são invert́ıveis. �
Proposição 7.17 Sejam V espaço vetorial real; v ∈ V; B, C bases ordenadas de V e MB,C matriz de mudança de bases
de B para C. Se [v]B e [v]C são as matrizes coluna das coordenadas de v em relação às bases B e C, respectivamente,
então
[v]B =MB,C. [v]C e [v]C =M
−1
B,C. [v]B .
Exemplo 7.53 Considere B = {e1, e2, e3} e C = {g1, g2, g3} bases de um espaço vetorial V tais que g1 = e1 + e3g2 = 2e1 + e2 + e3
g3 = e1 + 2e2 + e3
.
(i) Determinemos a matriz de mudança de bases de B para C.
(ii) Determinemos a matriz de mudança de bases de C para B.
(iii) Se v ∈ V é tal que v = (1, 1, 2)B, determinemos as coordenadas de v na base C.
Quanto ao item (i) temos
MB,C =
1 2 10 1 2
1 1 1

B,C
.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 309 de 351 páginas
Quanto ao item (ii), como MC,B =M
−1
B,C, calculemos a inversa de MB,C:
MB,C | Id3 =⇒
1 2 10 1 2
1 1 1
1 0 00 1 0
0 0 1
 .(-1)
�
+
=⇒
1 2 10 1 2
0 −1 0
 1 0 00 1 0
−1 0 1
 .(1)�
+
=⇒
1 2 10 1 2
0 0 2
 1 0 00 1 0
−1 1 1

.(1/2)
=⇒
1 2 10 1 2
0 0 1
 1 0 00 1 0
−1/2 1/2 1/2
 �+
.(-2)
�+
.(-1)
=⇒
1 2 00 1 0
0 0 1
 3/2 −1/2 −1/21 0 −1
−1/2 1/2 1/2
 �+.(-2) =⇒
1 0 00 1 0
0 0 1
−1/2 −1/2 3/21 0 −1
−1/2 1/2 1/2
 =⇒ Id3 | M−1B,C
Logo,
M−1B,C =MC,B =
−1/2 −1/2 3/21 0 −1
−1/2 1/2 1/2

C,B
.
Quanto ao item (iii), sendo
[v]B =
11
2

B
temos
[v]C =MC,B. [v]B =M
−1
B,C. [v]B =
−1/2 −1/2 3/21 0 −1
−1/2 1/2 1/2

B,C
11
2

B
=
 2−1
1

C
.
Logo, v = (2,−1, 1)C são as coordenadas de v na base C.
Notemos que neste exemplo, não conhecemos explicitamente os elementos das bases B e C. Aliás, não conhecemos
nem a natureza dos elementos de V, mas podemos trabalhar com coordenadas e matrizes de mudança de bases.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
GAAL UFU Página 323 de 351 páginas
Caṕıtulo 8
Transformações Lineares
As transformações lineares são o principal objeto de estudo da Álgebra Linear. Elas desempenham o mesmo papel
que as funções reais, de uma variável real, desempenham no Cálculo Diferencial e Integral 1. Veremos que o domı́nio
e o contra-domı́nio de transformações lineares são espaços vetoriais e, dáı, a importância do caṕıtulo anterior, onde
estudamos as diversas propriedades dessas importantes estruturas algébricas.
O ponto central desse caṕıtulo é a associação entre as transformações lineares e as matrizes, o que torna posśıvel
a transferência do estudo de tais transformações para o campo matricial. Não é preciso justificar que, tanto do ponto
de vista teórico, quanto computacional, o enfoque matricial é uma indiscut́ıvel vantagem em problemas envolvendo
transformações lineares, principalmente em situações e aplicações práticas.
8.1 O Conceito de Transformação Linear
Sejam U e V conjuntos não vazios. Uma aplicação de U em V é uma regra que associa cada elemento de U a
um único elemento de V. Indicamos tal aplicação por T : U→ V, com v = T (u), ou
T : U −→ V
u 7−→ v = T (u)
sendo U chamado de domı́nio de T e V o contra-domı́nio de T . O conjunto Im T = {v ∈ V : v = T (u) , u ∈ U},
também indicado por Im T = T (U), é chamado de conjunto imagem de T . Um elemento v = T (u) ∈ Im T é
chamado de imagem de u pela aplicação T .
A aplicação T : U→ V é chamada de injetiva (ou injetora) quando elementos distintos de U possuem imagens
distintas em V, ou seja:
∀u1, u2 ∈ U, u1 6= u2 ⇒ T (u1) 6= T (u2) ou, equivalentemente, T (u1) = T (u2)⇒ u1 = u2 .
A aplicação T : U → V é chamada de sobrejetiva (ou sobrejetora) quando todo elemento de V é imagem de
algum elemento de U pela aplicação T , ou seja:
∀v ∈ V, ∃u ∈ U tal que T (u) = v .A aplicação T : U→ V é chamada de bijetiva (ou bijetora) quando for simultaneamente injetiva e sobrejetiva.
Observação: quando a aplicação T : U→ V é bijetiva, podemos definir a aplicação inversa de T , ou seja, T−1 : V → U
tal que T ◦ T−1 = IdV : V → V e T−1 ◦ T = IdU : U→ U.
Exemplo 8.1 Seja a aplicação T : R2 → R2, T (x, y) = (x,−y). O domı́nio U e o contra-domı́nio V são iguais ao
conjunto R2.
A aplicação T é injetiva: sejam (x1, y1) , (x2, y2) ∈ R2 tais que T (x1, y1) = T (x2, y2)⇒ (x1,−y1) = (x2,−y2)⇒
x1 = x2 e −y1 = −y2 ⇒ x1 = x2 e y1 = y2 ⇒ (x1, y1) = (x2, y2).
A aplicação T é sobrejetiva: seja (a, b) ∈ V = R2. Tomando (a,−b) ∈ U = R2 temos T (a,−b) = (a,−(−b)) =
(a, b), ou seja, todo elemento do contra-domı́nio é imagem de algum elemento do domı́nio pela aplicação T . Isso
permite que escrevamos Im T = V = R2.
A aplicação T é bijetiva, pois é simultaneamente injetiva e sobrejetiva.
Na figura abaixo segue uma representação geométrica de T com exemplo de imagem de uma curva c.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 324 de 351 páginas UFU GAAL
0 x
( , )x y
x
y
y
U
0
x
( ,- )x y
x
-y
y
y
V
T
c
T c( )
Domínio
Contra-domínio
A aplicação T é uma reflexão em torno do eixo x e, geralmente, representamos uma curva no domı́nio e sua imagem
no contra-domı́nio no mesmo sistema de coordenadas:
0 x
( , )x y
x
y
y
U V=
( ,- )x y
-y
T
c
Reflex o em torno do eixo xã
T c( )
Exemplo 8.2 Seja a aplicação T : R2 → R2, T (x, y) = (0, y). O domı́nio U e o contra-domı́nio V são o conjunto R2.
A aplicação T não é injetiva pois, por exemplo, T (0, 0) = T (1, 0) = (0, 0) e, no entanto, (0, 0) 6= (0, 1).
A aplicação T também não é sobrejetiva pois, por exemplo, (1, 0) ∈ V = R2 e, no entanto, qualquer (x, y) ∈ R2 é
tal que T (x, y) = (0, y) 6= (1, 0). Portanto, (1, 0) ∈ V = R2 não é imagem de algum elemento de U = R2 pela aplicação
T . O conjunto imagem de T é o eixo y, ou seja, Im T = {(0, y) : y ∈ R}.
A aplicação T não é, portanto, bijetiva.
Na figura abaixo segue uma representação geométrica de T com exemplo de imagem de uma curva c.
0 x
( , )x y
x
y
y
U
0
( , )0 y
x
y
V
T
c
T c( )
Domínio
Contra-domínio
A aplicação T é uma projeção ortogonal no eixo y e, geralmente, representamos uma curva no domı́nio e sua
imagem no contra-domı́nio no mesmo sistema de coordenadas:
0 x
( , )x y
x
y
U V=
( , )0 y
T
c
T c( )
Projeção ortogonal no eixo y
Transformações Lineares
Há um tipo de aplicação que utilizaremos com muita frequência doravante, que são as transformações lineares.
Como o domı́nio e contra-domı́nio das transformações lineares são espaços vetoriais, devemos nos lembremos as con-
siderações do caṕıtulo anterior:
Salvo menção contrária, trabalharemos com espaços vetoriais reais, finitamente gerados e com operações usuais
Abaixo segue a definição:
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 325 de 351 páginas
Sejam U e V espaços vetoriais. Uma aplicação T : U→ V, v = T (u), é dita uma transformação linear de U
em V quando:
(i) T (u1 + u2) = T (u1) + T (u2) para quaisquer u1, u2 ∈ U.
(ii) T (αu) = αT (u) para quaisquer α ∈ R e u ∈ U.
Quando U = V, chamamos T de operador linear.
Exemplo 8.3 A aplicação T : R2 → R2, dada por T (x, y) = (x,−y), que é, no plano, a reflexão em torno do eixo x
vista acima, é um operador linear.
De fato:
(i) T ((x1, y1) + (x2, y2)) = T (x1 + x2, y1 + y2) = (x1 + x2,−(y1 + y2)) = (x1 + x2,−y1 − y2) =
(x1,−y1) + (x2,−y2) = T (x1, y1) + T (x2, y2) para quaisquer (x1, y1) , (x2, y2) ∈ R2.
(ii) T (α (x, y)) = T (αx, αy) = (αx,−αy) = α (x,−y) = αT (x, y) para quaisquer α ∈ R e (x, y) ∈ R2.
Exemplo 8.4 A aplicação T : R2 → R2, dada por T (x, y) = (0, y), que é, no plano, a projeção ortogonal no eixo y
vista acima, é um operador linear.
De fato:
(i) T ((x1, y1) + (x2, y2)) = T (x1 + x2, y1 + y2) = (0, y1 + y2) = (0+ 0, y1 + y2) = (0, y1) + (0, y2) = T (x1, y1) +
T (x2, y2) para quaisquer (x1, y1) , (x2, y2) ∈ R2.
(ii) T (α (x, y)) = T (αx, αy) = (0, αy) = (α0, αy) = α (0, y) = αT (x, y) para quaisquer α ∈ R e (x, y) ∈ R2.
Exemplo 8.5 A aplicação T : R2 → R3, dada por T (x, y) = (0, 0, 0), é uma transformação linear.
De fato:
(i) T ((x1, y1) + (x2, y2)) = T (x1 + x2, y1 + y2) = (0, 0, 0) = (0, 0, 0)+ (0, 0, 0) = T (x1, y1)+ T (x2, y2) para quaisquer
(x1, y1) , (x2, y2) ∈ R2.
(ii) T (α (x, y)) = T (αx, αy) = (0, 0, 0) = (α0, α0, α0) = α (0, 0, 0) = αT (x, y) para quaisquer α ∈ R e (x, y) ∈ R2.
Exemplo 8.6 A aplicação T : Pn (R)→ Pn−1 (R), dada por T (p) = p′ (derivada de p), é uma transformação linear.
De fato:
(i) T (p1 + p2) = (p1 + p2)
′
= p′1 + p
′
2 = T (p1) + T (p2) para quaisquer p1, p2 ∈ Pn (R).
(ii) T (αp) = (αp)
′
= αp′ = αT (p) para quaisquer α ∈ R e p ∈ Pn (R).
Exemplo 8.7 A aplicação T :M2 (R)→M2 (R), dada por T Åïx yz wòã = ïx+ y 00 z+wò, é um operador linear.
De fato:
(i) T
Åï
x1 y1
z1 w1
ò
+
ï
x2 y2
z2 w2
òã
= T
Åï
x1 + x2 y1 + y2
z1 + z2 w1 +w2
òã
=
ï
x1 + x2 + y1 + y2 0
0 z1 + z2 +w1 +w2
ò
=
=
ï
x1 + y1 0
0 z1 +w1
ò
+
ï
x2 + y2 0
0 z2 +w2
ò
= T
Åï
x1 y1
z1 w1
òã
+ T
Åï
x2 y2
z2 w2
òã
,
para quaisquer
ï
x1 y1
z1 w1
ò
,
ï
x2 y2
z2 w2
ò
∈M2 (R).
(ii) T
Å
α
ï
x y
z w
òã
= T
Åï
αx αy
αz αw
òã
=
ï
αx+ αy 0
0 αz+ αw
ò
= α
ï
x+ y 0
0 z+w
ò
= αT
Åï
x y
z w
òã
, para quaisquer
α ∈ R e
ï
x y
z w
ò
∈M2 (R).
Exemplo 8.8 (Não transformação linear) A aplicação F : R2 → R3, dada por F (x, y) = (x2, 0, 0), não é trans-
formação linear pois:{
F ((1, 1) + (2, 2)) = F (3, 3) = (9, 0, 0)
F (1, 1) + F (2, 2) = (1, 0, 0) + (4, 0, 0) = (5, 0, 0)
⇒ F ((1, 1) + (2, 2)) 6= F (1, 1) + F (2, 2)
Dentre as propriedades das transformações lineares que enunciaremos abaixo, temos o fato de o conjunto ima-
gem de uma transformação linear ser um subespaço vetorial de seu contra-domı́nio. Este novo “tipo” de subespaço
desempenhará um importante papel em nossos estudos, conforme veremos adiante.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 326 de 351 páginas UFU GAAL
Proposição 8.1 (Propriedades das Transformações Lineares) Sejam U e V espaços vetoriais reais e T : U → V
transformação linear. Então:
(1) T (0) = 0;
(2) T (−u) = −T (u) para qualquer u ∈ U;
(3) T (u1 − u2) = T (u1) − T (u2) para qualquer u1, u2 ∈ U;
(4) Se W é subespaço vetorial de U, então T (W) é subespaço vetorial de V; (em particular, Im T = T (U) é subespaço
vetorial de V)
(5) T
Å
n∑
i=1
αiui
ã
=
n∑
i=1
αiT (ui) para quaisquer αi ∈ R e ui ∈ U.
Composição de Transformações Lineares
Assim como ocorre com as funções do Cálculo, podemos pensar em composição de transformações lineares, conforme
definição abaixo.
Sejam U, V e W espaços vetoriais; S : U→ V e T : V →W transformações lineares.
Definimos T ◦ S : U→W tal que T ◦ S (u) = T (S (u)), ∀u ∈ U.
U V W
S T
T S°
A aplicação T ◦ S é chamada de composta de T com S.
Exemplo 8.9 Sejam S : R2 → R3, dada por S (x, y) = (x+ y, y, x) e T : R3 → R4, dada por T (x, y, z) =
(0, x+ y, y+ z, 0). Ambas as aplicações são transformações lineares.
A composta T ◦ S : R2 → R4 é tal que T ◦ S (x, y) = T (S (x, y)) = T (x+ y, y, x) = (0, (x+ y) + y, y+ x, 0) =
(0, x+ 2y, y+ x, 0).
Sobre a composição de transformações lineares temos o seguinte importante resultado, cuja demonstração fica a
cargo do leitor.
Proposição 8.2 A composta de duas transformações lineares também é uma transformação linear.
8.2 Núcleo de uma Transformação Linear
Sejam U e V espaços vetoriais reais e T : U→ V transformação linear. Chama-se núcleo (1) de T , e indica-se por
ker T (ou N (T))o seguinte subconjunto de U:
ker T = {u ∈ U : T (u) = 0} .
0
U
ker T
T V
Exemplo 8.10 A aplicação T : R2→ R2, dada por T (x, y) = (y, x), é um operador linear e
ker T =
{
(x, y) ∈ R2 : T (x, y) = (0, 0)
}
=
{
(x, y) ∈ R2 : (y, x) = (0, 0)
}
= {(0, 0)} .
1Kernel, em ĺıngua alemã.
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 327 de 351 páginas
Exemplo 8.11 A aplicação T : R2 → R2, dada por T (x, y) = (0, x+ y), é um operador linear e
ker T =
{
(x, y) ∈ R2 : T (x, y) = (0, 0)
}
=
{
(x, y) ∈ R2 : (0, x+ y) = (0, 0)
}
=
{
(x, y) ∈ R2 : x+ y = 0
}
=
{
(x, y) ∈ R2 : y = −x
}
=
{
(x,−x) ∈ R2
}
=
{
x (1,−1) ∈ R2
}
= [(1,−1)] .
Exemplo 8.12 A aplicação T : R2 → R3, dada por T (x, y) = (x, x+ y, y), é uma transformação linear e
ker T =
{
(x, y) ∈ R2 : T (x, y) = (0, 0, 0)
}
=
{
(x, y) ∈ R2 : (x, x+ y, y) = (0, 0, 0)
}
=
{
(x, y) ∈ R2 : x = y = 0
}
= {(0, 0)} .
Exemplo 8.13 A aplicação T : Pn (R)→ Pn−1 (R), dada por T (p) = p′, é uma transformação linear e
ker T = {p ∈ Pn (R) : T (p) = 0} = {p ∈ Pn (R) : p′ = 0} = {p ∈ Pn (R) : p é polinômio constante} .
Exemplo 8.14 A aplicação T : U→ V, dada por T (u) = 0, é uma transformação linear (transformação nula) e
ker T = {u ∈ U : T (u) = 0} = U.
Exemplo 8.15 A aplicação T : U→ U, dada por f (u) = u, é um operador linear (operador identidade) e
ker T = {u ∈ U : T (u) = 0} = {u ∈ U : u = 0} = {0} .
Dentre os diversos resultados matemáticos envolvendo o núcleo de uma transformação linear temos o fato de que
ele é um importante subespaço do domı́nio da transformação. Portanto, temos um novo “tipo” de subespaço que,
junto com o subespaço imagem de uma transformação culmina em um importante teorema da Álgebra Linear que
veremos mais adiante.
Proposição 8.3 Sejam U e V espaços vetoriais reais e T : U→ V transformação linear. Então:
(1) ker T é um subespaço vetorial de U;
(2) ker T = {0} se, e somente se, T é injetiva.
Exemplo 8.16 Seja T : R3 → R, dada por T (x, y, z) = −2x+3y+7z, uma transformação linear. Determinemos uma
base e a dimensão de ker T .
Temos
ker T =
{
(x, y, z) ∈ R3 : T (x, y, z) = 0
}
=
{
(x, y, z) ∈ R3 : −2x+ 3y+ 7z = 0
}
=
{
(x, y, z) ∈ R3 : x = 3
2
y+ 7
2
z
}
=
{(
3
2
y+ 7
2
z, y, z
)
∈ R3
}
=
{(
3
2
y, y, 0
)
+
(
7
2
z, 0, z
)
: y, z ∈ R
}
=
{
y
(
3
2
, 1, 0
)
+ z
(
7
2
, 0, 1
)
: y, z ∈ R
}
=
[(
3
2
, 1, 0
)
,
(
7
2
, 0, 1
)]
.
Como B =
{(
3
2
, 1, 0
)
,
(
7
2
, 0, 1
)}
é LI e gera ker T , então B é base de ker T e, portanto, dim ker T = 2.
Exemplo 8.17 Seja T : R4 → R3, dada por T (x, y, z, t) = (x− y+ z+ t, x+ 2z− t, x+ 3y+ 3z− 3t), uma trans-
formação linear. Determinemos uma base e a dimensão de ker T e Im T .
Quanto ao núcleo:
ker T =
{
(x, y, z, t) ∈ R4 : T (x, y, z, t) = (0, 0, 0)
}
=
{
(x, y, z, t) ∈ R4 : (x− y+ z+ t, x+ 2z− t, x+ 3y+ 3z− 3t) = (0, 0, 0)
}
=
(x, y, z, t) ∈ R4 :
 x − y + z + t = 0x + 2z − t = 0
x + 3y + 3z − 3t = 0
 = · · ·
=
{
(x, y, z, t) ∈ R4 : x = −3t, y = 0, z = 2t
}
=
{
(−3t, 0, 2t, t) ∈ R4
}
= {t (−3, 0, 2, 1) : t ∈ R}
= [(−3, 0, 2, 1)] .
Logo, B = {(−3, 0, 2, 1)} é base de ker T e sua dimensão é 1.
Quanto ao conjunto imagem:
Im T =
{
(a, b, c) ∈ R3 : ∃ (x, y, z, t) ∈ R4 tal que T (x, y, z, t) = (a, b, c)
}
=
{
T (x, y, z, t) ∈ R3
}
=
{
(x− y+ z+ t, x+ 2z− t, x+ 3y+ 3z− 3t) ∈ R3
}
= {x (1, 1, 1) + y (−1, 0, 3) + z (1, 2, 3) + t (1,−1,−3) : x, y, z, t ∈ R}
= [(1, 1, 1) , (−1, 0, 3) , (1, 2, 3) , (1,−1,−3)] .
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 328 de 351 páginas UFU GAAL
Encontremos uma base para Im T utilizando o procedimento prático que vimos no Caṕıtulo 7:
1 1 1
−1 0 3
1 2 3
1 −1 −3

.(1)�
+
.(-1)
�
+
.(-1)
�
+
∼=

1 1 1
0 1 4
0 1 2
0 −2 −4
 .(-1)�+ .(2)�
+
∼=

1 1 1
0 1 4
0 0 −2
0 0 4
 .(2)�
+
∼=

1 1 1
0 1 4
0 0 −2
0 0 0
 .
Logo, Im T = [(1, 1, 1) , (0, 1, 4) , (0, 0,−2)] e B = {(1, 1, 1) , (0, 1, 4) , (0, 0,−2)} é base de Im T . Assim, dim Im T = 3.
Como Im T ⊂ R3 e dimR3 = 3, temos Im T = R3 (Proposição 7.12, página 303) e, portanto, T é sobrejetiva.
A proposição abaixo, conhecida como Teorema do Núcleo e da Imagem, é um resultado muito importante na
Álgebra Linear. Ela relaciona os dois novos “tipos” de subespaços vetoriais que introduzimos neste caṕıtulo: o núcleo
e o conjunto imagem de uma transformação linear.
Proposição 8.4 (Teorema do Núcleo e da Imagem) Sejam U e V espaços vetoriais reais de dimensões finitas. Se
T : U→ V é uma transformação linear, então
dimU = dim ker T + dim Im T .
Exemplo 8.18 Mostremos que a transformação linear T : R3 → R4, dada por T (x, y, z) = (x, x− y, y− z, z) é
injetiva, mas não é sobrejetiva.
Temos U = R3, V = R4 e
ker T =
{
(x, y, z) ∈ R3 : T (x, y, z) = (0, 0, 0, 0)
}
=
{
(x, y, z) ∈ R3 : (x, x− y, y− z, z) = (0, 0, 0, 0)
}
= {(0, 0, 0)} .
Logo, de ker T = {(0, 0, 0)}⇒ T é injetiva, pela Proposição 8.3, página 327.
Temos dim ker T = 0. Como dimU = 3, pelo Teorema do Núcleo e da Imagem (Proposição 8.4) temos dim Im T = 3.
Como dimV = 4, temos Im T 6= R4 e, portanto, T não é sobrejetiva.
Exemplo 8.19 Determinemos uma transformação linear T : R3 → R4 tal que Im T = [(1, 1, 2, 1) , (2, 1, 0, 1)].
O conjunto BIm T = {(1, 1, 2, 1) , (2, 1, 0, 1)} é LI e serve de base de Im T . Logo, dim Im T = 2.
Como dimR3 = 3, pelo Teorema do Núcleo e da Imagem (Proposição 8.4), dim ker T = 1, ou seja, ker T = [(a, b, c)],
(a, b, c) 6= (0, 0, 0), e Bker T = {(a, b, c)} é base de ker T .
Uma das estratégias para encontrar a transformação linear pedida é igualar elementos de Bker T com elementos de
uma base do domı́nio de T e relacionar os demais elementos da base do domı́nio aos elementos de BIm T pela T .
Sendo BR3 = {(1, 0, 0) , (0, 1, 0) , (0, 0, 1)} a base canônica de R3, definamos:
(1, 0, 0) = (a, b, c)⇒ T (1, 0, 0) = (0, 0, 0, 0)
T (0, 1, 0) = (1, 1, 2, 1)
T (0, 0, 1) = (2, 1, 0, 1)
Assim,
T (x, y, z) = T (x (1, 0, 0) + y (0, 1, 0) + z (0, 0, 1)) = xT (1, 0, 0) + yT (0, 1, 0) + zT (0, 0, 1)
= x (0, 0, 0, 0) + y (1, 1, 2, 1) + z (2, 1, 0, 1)⇒ T (x, y, z) = (y+ 2z, y+ z, 2y, y+ z) .
A transformação linear T satisfaz o que foi pedido.
Exemplo 8.20 Achemos uma transformação linear T : R3 → R2 tal que ker T = [(1, 1, 0)].
Como dimR3 = 3 e dim ker T = 1, o Teorema do Núcleo e da Imagem (Proposição 8.4) nos fornece dim Im T = 2
e, como dimR2 = 2 temos Im T = R2. Portanto, T é sobrejetiva.
Uma das estratégias para encontrar a transformação linear pedida é semelhante à estratégia do exemplo anterior.
Tomemos uma base BR3 do domı́nio de T que contenha o elemento (1, 1, 0) (que gera ker T), por exemplo, BR3 =
{(1, 1, 0) , (0, 1, 0) , (0, 0, 1)}.
Tomemos uma base BR2 do contra-dominio de T , por exemplo, a base canônica BR2 = {(1, 0) , (0, 1)}.
Sendo T (1, 1, 0) = (0, 0), definamos
T (0, 1, 0) = (1, 0)
T (0, 0, 1) = (0, 1)
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 329 de 351 páginas
De (x, y, z) = a (1, 1, 0) + b (0, 1, 0) + c (0, 0, 1)⇒
 a = xa+ b = y
c = z
⇒
 a = xb = y− x
c = z
, e podemos escrever (x, y, z) =
x (1, 1, 0) + (y− x) (0, 1, 0) + z (0, 0, 1).
Logo,
T (x, y, z) = T (x (1, 1, 0) + (y− x) (0, 1, 0) + z (0, 0, 1)) = xT (1, 1, 0) + (y− x) T (0, 1, 0) + zT (0, 0, 1)
= x (0, 0) + (y− x) (1, 0) + z (0, 1)⇒ T (x, y, z) = (y− x, z) .
A transformação linear T satisfaz o que foi pedido.
Fechamos esta seção com uma algumas consequências do Teorema do Núcleo e da Imagem.
Proposição 8.5 (Corolário do Teorema do Núcleo e da Imagem) Sejam U e V espaços vetorais reais tais que
dimU = dimV e T : U→ V é transformação linear. Então, são equivalentes as seguintes afirmações:
(1) T é sobrejetiva;
(2) T é injetiva;
(3) T é bijetiva;
(4) B é base de U⇒ T (B) é base de V.
8.3 Isomorfismos e Automorfismos
As transformações lineares bijetivas possuem inversas e, por essemotivo, desempenham um importante papel em
diversas aplicações da Álgebra Linear. Nesta seção vamos estudá-las com um pouco mais de detalhes.
Uma transformação linear T : U → V, sendo U e V espaços vetoriais reais, é um isomorfismo de U em V
quando T é bijetiva.
Obviamente, quanto T é um isomorfismo, T−1 : V → U é também um isomorfismo, chamado de isomorfismo
inverso de T .
Dizemos que U e V são espaços vetoriais isomorfos quando existe um isomorfismo entre eles.
Quando T é isomorfismo e U = V, o operador linear T é dito automorfismo em U.
Exemplo 8.21 SendoU espaço vetorial e T : U→ U, com T (u) = u (transformação identidade), temos, naturalmente,
um automorfismo em U.
Exemplo 8.22 A transformação linear T : R2 → P1 (R), dada por T (a, b) = a + (a+ b) x, é um isomorfismo de R2
em P1 (R).
De fato,
ker T =
{
(a, b) ∈ R2 : T (a, b) = 0
}
=
{
(a, b) ∈ R2 : a+ (a+ b) x = 0
}
=
{
(a, b) ∈ R2 : a = b = 0
}
= {(0, 0)} .
Logo, ker T = {0} e, portanto, T é injetiva (Proposição 8.3, página 327).
Como dimR2 = dimP1 (R) = 2 e T é injetiva, pelo Corolário do Teorema do Núcleo e da Imagem acima (Proposição
8.5), temos T bijetiva.
Calculemos o isomorfismo inverso T−1 : P1 (R)→ R2, isto é, dado p (x) = α+βx ∈ P1 (R), calculemos T−1 (α+ βx).
Sendo (a, b) ∈ R2 tal que
T−1 (α+ βx) = (a, b)⇐⇒ T (a, b) = α+βx⇐⇒ a+(a+ b) x = α+βx⇐⇒ a = α e a+b = β⇐⇒ a = α e b = β−α,
ou seja, T−1 : P1 (R)→ R2 é dada por T−1 (α+ βx) = (α,β− α).
Exemplo 8.23 Mostremos que o subespaço vetorial U dos pontos (x, y, z) ∈ R3 tais que z = 0 é isomorfo a R2.
Devemos mostrar que existe um isomorfismo entre U =
{
(x, y, z) ∈ R3 : z = 0
}
e V = R2.
Definamos
T : R2 −→ U
(x, y) 7−→ (x, y, 0) .
É fácil mostrar que T é uma transformação linear.
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 330 de 351 páginas UFU GAAL
Quanto à injetividade de T :
ker T =
{
(x, y) ∈ R2 : T (x, y) = (0, 0, 0)
}
=
{
(x, y) ∈ R2 : (x, y, 0) = (0, 0, 0)
}
= {(0, 0)} .
Logo, ker T = {0} e, portanto, T é injetiva (Proposição 8.3, página 327).
Sendo dimU = dimR2 = 2 e T injetiva, o Corolário do Teorema do Núcleo e da Imagem (Proposição 8.5) permite
que concluamos que T é uma bijeção.
Proposição 8.6 Sejam U e V espaços vetoriais reais finitamente gerados. Temos:
U e V são isomorfos se, e somente se, dimU = dimV.
Como encontrar o isomorfismo que a Proposição 8.6 acima garante que existe?
Um dos procedimentos para encontrar T : U → V é considerarmos uma base BU = {u1, . . . , un} de U, uma base
BV = {v1, . . . , vn} de V e definirmos
T (ui) = vi, i = 1, . . . , n.
Com essas informações é posśıvel deduzir a expressão anaĺıtica de T . Vejamos um exemplo.
Exemplo 8.24 Encontremos um isomorfismo entre M2 (R) e P3 (R).
Observemos que dimM2 (R) = dimP3 (R) = 4.
Sejam B1 =
{ï
1 0
0 0
ò
,
ï
0 1
0 0
ò
,
ï
0 0
1 0
ò
,
ï
0 0
0 1
ò}
base canônica de M2 (R) e B2 =
{
1, x, x2, x3
}
base canônica de
P3 (R). Definamos T :M2 (R)→ P3 (R) tal que
T
Åï
1 0
0 0
òã
= 1; T
Åï
0 1
0 0
òã
= x; T
Åï
0 0
1 0
òã
= x2; T
Åï
0 0
0 1
òã
= x3.
Sendo ï
a b
c d
ò
= a
ï
1 0
0 0
ò
+ b
ï
0 1
0 0
ò
+ c
ï
0 0
1 0
ò
+ d
ï
0 0
0 1
ò
,
temos
T
Åï
a b
c d
òã
= T
Å
a
ï
1 0
0 0
ò
+ b
ï
0 1
0 0
ò
+ c
ï
0 0
1 0
ò
+ d
ï
0 0
0 1
òã
= aT
Åï
1 0
0 0
òã
+ bT
Åï
0 1
0 0
òã
+ cT
Åï
0 0
1 0
òã
+ dT
Åï
0 0
0 1
òã
= a1+ bx+ cx2 + dx3.
Assim,
T : M2 (R) −→ P3 (R)ï
a b
c d
ò
7−→ a+ bx+ cx2 + dx3
é um isomorfismo.
Observação: O exemplo acima é muito importante, pois também estabelece um método para encontrar uma trans-
formação linear a partir da relação entre os elementos das bases do domı́nio e do contra-domı́nio da transformação.
8.4 Matrizes e Transformações Lineares
Espaço Vetorial das Transformações Lineares de U em V
Estamos prontos para definir no nosso quinto tipo de espaço vetorial. Vejamos:
Consideremos U e V espaços vetoriais e consideremos L (U,V) como sendo o conjunto de todas as transformações
lineares de U em V. Quando U = V é comum designar L (U,V) simplesmente por L (U) (ou L (V)).
Definamos a adição entre S, T ∈ L (U,V) do seguinte modo:
(S+ T) (u) = S (u) + T (u), ∀u ∈ U .
Com essa definição, não é dif́ıcil verificar que S+ T ∈ L (U,V).
Definamos a multiplicação por escalar entre T ∈ L (U,V) e α ∈ R do seguinte modo:
(αT) (u) = αT (u), ∀u ∈ U e ∀α ∈ R .
Também não é dif́ıcil mostrar que (αT) ∈ L (U,V).
Edson Agustini sites.google.com/site/edsonagustini agustini@ufu.br
sites.google.com/site/edsonagustini
GAAL UFU Página 331 de 351 páginas
Proposição 8.7 Sejam U e V espaços vetoriais reais e L (U,V) o conjunto das transformações lineares de U em V
munido das operações acima definidas. Então, L (U,V) é um espaço vetorial real.
Matriz de uma Transformação Linear
Conforme já adiantamos na introdução deste caṕıtulo, a associação das transformações lineares com as matrizes é
uma das mais importantes ferramentas da Álgebra Linear. Vejamos como proceder:
Sejam U e V espaços vetoriais reais e T : U → V transformação linear. Tomemos dimU = n, dimV = m,
B = {u1, . . . , un} e C = {v1, . . . , vm} bases de U e V, respectivamente.
Podemos escrever 
T (u1) = α11v1 + α21v2 + · · ·+ αm1vm
T (u2) = α12v1 + α22v2 + · · ·+ αm2vm
...
T (un) = α1nv1 + α2nv2 + · · ·+ αmnvm
e definir a matriz
[T ]B,C =

α11 α12 · · · α1n
α21 α22 · · · α2n
...
αm1 αm2 · · · αmn

m×n
que é chamada de matriz da transformação linear T com relação às bases B e C.
Quando B = C denotamos [T ]B,C simplesmente por [T ]B.
Observemos que a matriz de uma transformação linear depende das bases escolhidas para o domı́nio e contra-
domı́nio da transformação.
Exemplo 8.25 Determinemos a matriz da transformação linear T : R2 → R3 tal que T (x, y) = (x, x, x+ y) sendo
B = {(1, 1) , (1,−1)} base de R2 e C = {(1, 0, 0) , (0, 1, 1) , (0, 0, 1)} base de R3.
Temos {
T (1, 1) = (1, 1, 2) = α11 (1, 0, 0) + α21 (0, 1, 1) + α31 (0, 0, 1)
T (1,−1) = (1, 1, 0) = α12 (1, 0, 0) + α22 (0, 1, 1) + α32 (0, 0, 1)
⇒{
(α11, α21, α21 + α31) = (1, 1, 2)
(α12, α22, α22 + α32) = (1, 1, 0)
⇒ { α11 = 1; α21 = 1; α31 = 1
α12 = 1; α22 = 1; α32 = −1
Logo,
[T ]B,C =
1 11 1
1 −1

3×2
Exemplo 8.26 Determinemos [T ]B,C, sendo T : P2 (R) → P3 (R) tal que T (p (t)) = t.p (t), e sendo B = {1, t, t2} e
C =
{
1, 1− t, 1− t2, 1− t3
}
.
Temos  T (1) = t.1 = α111+ α21 (1− t) + α31
(
1− t2
)
+ α41
(
1− t3
)
T (t) = t.t = α121+ α22 (1− t) + α32
(
1− t2
)
+ α42
(
1− t3
)
T
(
t2
)
= t.t2 = α131+ α23 (1− t) + α33
(
1− t2
)
+ α43
(
1− t3
) ⇒ · · ·
· · ·⇒
 α11 = 1; α21 = −1; α31 = 0; α41 = 0α12 = 1; α22 = 0; α32 = −1; α42 = 0
α13 = 1; α23 = 0; α33 = 0; α43 = −1
Logo,
[T ]B,C =

1 1 1
−1 0 0
0 −1 0
0 0 −1

4×3
agustini@ufu.br sites.google.com/site/edsonagustini Edson Agustini
sites.google.com/site/edsonagustini
Página 332 de 351 páginas UFU GAAL
Observações:
(1) Se T : U → U é a transformação linear identidade, ou seja, T (u) = u, sendo B = {u1, . . . , un} e C = {v1, . . . , vn}
bases para U (B para o domı́nio e C para o contra-domı́nio), então [T ]B,C coincide com a matriz mudança de base, da
base C para a base B, ou seja, [T ]B,C =MC,B.
(2) Se T : U → V é transformação linear, dimU = n, dimV = m, B é base para o domı́nio U e C é base para o
contra-domı́nio V, então [T ]B,C é matriz nula se, e somente se, T é transformação linear nula, ou seja,
[T ]B,C = [0]m×n ⇐⇒ T (u) = 0, ∀u ∈ U,
sendo 0 o elemento neutro de V.
(3) Se S, T : U→ V são transformações lineares, B é base para o domı́nio U e C é base para o contra-domı́nio V, então
[S+ T ]B,C = [S]B,C + [T ]B,C
[αT ]B,C = α [T ]B,C , sendo α ∈ R.
O resultado matemático que permite que trabalhemos com matrizes no lugar de transformações lineares é dado
abaixo.
Proposição 8.8 Sejam U,V espaços vetoriais reais, dimU = n, dimV = m, B base de U e C base

Mais conteúdos dessa disciplina