J. Umberto Cinelli L. de Oliveira∗
Tópicos Breves
de
Matemática Básica
(8 de abril de 2005)
UERJ – IF – DFT
∗DFT
Rio de Janeiro – RJ – Brasil
– IF – UERJ
•C •V •A •Ṕ •T •Ṕ. 1 •Ú •S
© J. Umberto Cinelli L. de Oliveira
Editora i π2
Rio de Janeiro – Rio de Janeiro – Brasil
2005
compilado em 8 de abril de 2005 às 12 h 50 min
•C •V •A •Ṕ •T •Ṕ. 3 •Ú •S
Sumário
Apresentação
Orientação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
14
17
Notação empregada
19
I
Álgebra
23
1
Tópicos de álgebra
1.1 Relação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Relação de equivalência . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Função . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
25
27
32
•C •V •A •Ṕ •T •Ṕ. 4 •Ú •S
1.2.1
1.2.2
1.2.3
1.2.4
1.2.5
1.2.6
1.2.7
1.3
Conjunto imagem . . . . . . . . . . . . . . . . .
Injeção, sobrejeção e bijeção . . . . . . . . . . .
Composição de funções . . . . . . . . . . . . .
Função inversa . . . . . . . . . . . . . . . . . .
Operações . . . . . . . . . . . . . . . . . . . . .
Principais propriedades . . . . . . . . . . . . .
Conseqüências das propriedades
de uma operação . . . . . . . . . . . . . . . . .
1.2.8 Homomorfismo, isomorfismo e automorfismo
Grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Axiomas de grupo . . . . . . . . . . . . . . . .
1.3.2 Propriedades de grupos . . . . . . . . . . . . .
1.3.3 Exemplos de grupos finitos . . . . . . . . . . .
1.3.3.1 Grupos de ordem 1 . . . . . . . . . .
1.3.3.2 Grupos de ordem 2 . . . . . . . . . .
1.3.3.3 Grupos de ordem 3 . . . . . . . . . .
1.3.3.4 Grupos de ordem 4 . . . . . . . . . .
1.3.4 Exemplos de grupos infinitos . . . . . . . . . .
1.3.4.1 Grupo de adição
nos inteiros . . . . . . . . . . . . . . .
1.3.4.2 Grupo de multiplicação
nos racionais . . . . . . . . . . . . . .
1.3.4.3 Grupo de adição nas matrizes . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
34
34
37
38
41
42
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
44
48
50
50
54
57
57
57
58
59
61
. . . . . . . . . . .
61
. . . . . . . . . . .
. . . . . . . . . . .
62
63
•C •V •A •Ṕ •T •Ṕ. 5 •Ú •S
1.3.4.4
1.4
1.5
1.6
2
Grupo de transformações
em um conjunto . . . . . . . . . . .
1.3.4.5 Notação exponencial . . . . . . . .
1.3.4.6 Expoente inteiro . . . . . . . . . . .
1.3.5 Grupos isomorfos . . . . . . . . . . . . . . . .
1.3.6 Grupo comutativo . . . . . . . . . . . . . . .
Corpo . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Axiomas de corpo . . . . . . . . . . . . . . .
1.4.2 Solução de uma equação do primeiro grau .
1.4.3 Solução da equação do segundo grau . . . .
1.4.4 Solução da equação do 2o¯ grau em um corpo
1.4.5 Corpo ordenado . . . . . . . . . . . . . . . .
1.4.6 Valor absoluto num corpo ordenado . . . . .
1.4.6.1 Nota . . . . . . . . . . . . . . . . . .
1.4.7 Sistema de equações lineares . . . . . . . . .
1.4.7.1 Resolução utilizando as
características de corpo . . . . . . .
1.4.7.2 Utilizando a álgebra matricial . . .
Deslocamentos e grandezas vetoriais . . . . . . . . .
Corpo dos complexos . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
64
64
66
67
68
69
69
79
81
83
85
88
90
90
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. 92
. 95
. 99
. 115
Estudo de Algumas Funções Elementares
123
2.1 Função do primeiro grau . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
2.2 Teorema de Pitágoras, uma demonstração . . . . . . . . . . . . . . . . . 134
•C •V •A •Ṕ •T •Ṕ. 6 •Ú •S
2.3
2.4
2.5
2.6
Razão de semelhança em um triângulo retângulo . . .
Funções seno, cosseno e tangente . . . . . . . . . . . .
Rotação dos eixos coordenados no plano . . . . . . . .
Relações trigonométricas . . . . . . . . . . . . . . . . .
2.6.1 Tangente da soma . . . . . . . . . . . . . . . . .
2.6.2 Redução ao primeiro quadrante . . . . . . . .
2.7 Funções trigonométricas inversas . . . . . . . . . . . .
2.7.1 Função arco seno . . . . . . . . . . . . . . . . .
2.7.2 Função arco cosseno . . . . . . . . . . . . . . .
2.7.3 Função arco tangente . . . . . . . . . . . . . . .
2.8 Derivadas das funções trigonométricas . . . . . . . .
2.9 Lei do cosseno e lei dos senos . . . . . . . . . . . . . .
2.9.1 Lei do cosseno (argumento geométrico) . . . .
2.9.2 Lei do cosseno (argumento algébrico) . . . . .
2.9.3 Lei dos senos (argumento geométrico) . . . .
2.9.4 Lei dos senos (argumento algébrico) . . . . . .
2.10 Função exponencial e função logaritmo . . . . . . . .
2.10.1 Expoentes racionais . . . . . . . . . . . . . . .
2.10.2 Função logaritmo e exponencial
sobre os racionais . . . . . . . . . . . . . . . .
2.10.2.1 Problema . . . . . . . . . . . . . . . .
2.10.3 Função logaritmo e exponencial sobre os reais
2.10.4 Funções algébricas e funções transcendentes .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
139
142
145
151
152
152
156
160
161
162
163
169
170
171
172
175
177
177
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
179
182
182
191
•C •V •A •Ṕ •T •Ṕ. 7 •Ú •S
2.11 Série de Taylor . . . . . . . . . . . . . . . . . . . . . .
2.11.1 Série de Taylor para função de uma variável
2.11.2 Série de Taylor
para função de várias variáveis . . . . . . .
2.12 Estudo da função do segundo grau . . . . . . . . .
2.12.1 Observações preliminares,
diferencial de uma função . . . . . . . . . .
2.12.2 Características da função do segundo grau .
2.13 Representação polar dos números complexos . . . .
2.14 Definição da exponencial complexa . . . . . . . . . .
2.14.1 Proposições . . . . . . . . . . . . . . . . . . .
2.14.2 Seno e cosseno da soma . . . . . . . . . . . .
2.14.3 Derivadas do seno e do cosseno . . . . . . .
2.15 Funções hiperbólicas . . . . . . . . . . . . . . . . . .
2.15.1 Definição das funções hiperbólicas . . . . . .
2.15.2 Derivadas das funções hiperbólicas . . . . .
2.15.3 Funções hiperbólicas inversas . . . . . . . . .
2.15.4 Relação entre funções
hiperbólicas e trigonométricas . . . . . . . .
II
3
Geometria
Estudo das cônicas
. . . . . . . . . . . . 192
. . . . . . . . . . . . 192
. . . . . . . . . . . . 197
. . . . . . . . . . . . 200
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
200
203
207
210
212
215
216
218
219
223
223
. . . . . . . . . . . . 228
230
231
•C •V •A •Ṕ •T •Ṕ. 8 •Ú •S
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
4
Introdução . . . . . . . . . . . . .
Equação polar das cônicas . . . .
Equações cartesianas das cônicas
Considerações . . . . . . . . . . .
Elipse . . . . . . . . . . . . . . . .
Círculo . . . . . . . . . . . . . . .
Parábola . . . . . . . . . . . . . .
Hipérbole . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Coordenadas curvilíneas
4.1 Sistema de coordenadas curvilíneas . . . . . . . .
4.1.1 Base local para vetores localizados . . . . .
4.1.2 Componentes da posição, velocidade e
da aceleração . . . . . . . . . . . . . . . . .
4.1.3 Coordenadas cilíndricas . . . . . . . . . . .
4.1.4 Coordenadas esféricas . . . . . . . . . . . .
4.2 Triedro e fórmulas de Frenet . . . . . . . . . . . . .
4.2.1 Conceituação de reta tangente a uma curva
4.2.2 Função vetorial e suas derivadas
em base de Frenet . . . . . . . . . . . . . .
4.2.3 Observações . . . . . . . . . . . . . . . . . .
4.2.3.1 Sobre o plano osculador . . . . .
4.2.3.2 Interpretação dos componentes
da aceleração em base de Frenet .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
231
233
234
238
239
243
244
245
253
. . . . . . . . . . . . . 255
. . . . . . . . . . . . . 264
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
268
272
275
279
280
. . . . . . . . . . . . . 287
. . . . . . . . . . . . . 292
. . . . . . . . . . . . . 292
. . . . . . . . . . . . . 292
•C •V •A •Ṕ •T •Ṕ. 9 •Ú •S
4.2.3.3
4.3
4.4
4.5
4.6
Interpretação dos componentes
do sacolejo em base de Frenet . . . . . . .
4.2.3.4 Quanto ao triedro de Frenet estar definido
Análise Vetorial . . . . . . . . . . . . . . . . . . . . . . . . .
Gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4.1 Relação entre derivada direcional e gradiente . . .
4.4.2 Significado da direção do vetor gradiente . . . . . .
4.4.3 Gradiente de operações com funções . . . . . . . . .
4.4.4 Gradiente das coordenadas curvilíneas ortogonais
4.4.5 Operador nabla . . . . . . . . . . . . . . . . . . . . .
Divergente . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5.1 Teorema de Gauss . . . . . . . . . . . . . . . . . . .
4.5.2 Linearidade do divergente . . . . . . . . . . . . . .
4.5.3 Elemento de volume . . . . . . . . . . . . . . . . . .
4.5.4 Elemento de área . . . . . . . . . . . . . . . . . . . .
4.5.5 Divergente dos vetores de uma base . . . . . . . . .
4.5.6 Divergente de um campo vetorial . . . . . . . . . .
4.5.7 Laplaciano . . . . . . . . . . . . . . . . . . . . . . . .
Rotacional . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.6.1 Rotacional em coordenadas curvilíneas . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
293
295
295
302
310
310
311
311
312
313
315
316
317
318
319
322
325
327
327
•C •V •A •Ṕ •T •Ṕ. 10 •Ú •S
Apêndices
332
A Números Naturais
332
A.1 A raiz quadrada de 2 não é racional, uma prova . . . . . . . . . . . . . . 335
B Tabela ilustrativa para a derivada de uma função
338
B.0.1 Programa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
C Notação de índice e de somatório
346
C.1 Notação de índice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
C.1.1 Notação de somatório . . . . . . . . . . . . . . . . . . . . . . . . . 348
C.1.2 Principais propriedades do somatório . . . . . . . . . . . . . . . . 350
D Funções homogêneas
D.1 Definição de função homogênea (Euler) . .
D.2 O teorema de Euler . . . . . . . . . . . . . .
D.3 Teoremas envolvendo funções homogêneas
D.4 Exemplos de função homogênea . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
352
352
353
354
356
E Gráficos de algumas funções
358
Alfabeto grego
378
Figuras
380
•C •V •A •Ṕ •T •Ṕ. 11 •Ú •S
Tabelas
382
Referências
383
Índice Remissivo
386
•C •V •A •Ṕ •T •Ṕ. 12 •Ú •S
Este texto tem como origem uma encomenda feita pelo Prof. Joaquim Pereira Neto
depois de muita conversa sobre educação. A idéia central era um texto de apoio para
um curso livre voltado a estudantes do IF–UERJ que cobrisse tópicos de matemática,
tanto matemática dos cursos de segundo grau, com roupagem mais formal sofisticada
e adulta, levando em conta Cálculo e Análise Vetorial.
Agradeço a todos que cooperaram de alguma forma para este trabalho,
principalmente ao próprio Prof. Joaquim e ao Prof. Jader Benuzzi Martins.
Não poderia poupar agradecimento a meus familiares e a minha querida Evelyn,
esposa e companheira.
Umberto
12/7/2001
•C •V •A •Ṕ •T •Ṕ. 13 •Ú •S
Apresentação
O objetivo deste texto é dotar o estudante universitário (dos quatro primeiros períodos)
de conhecimento sólido de conceitos básicos fundamentais em Matemática para a Física
e matérias afins, de tal maneira que se sinta seguro e consciente para entender o que lê
nos textos, o que é posto em aula e para a forma como está operando matematicamente,
entretanto sem apresentar roteiro de procedimento operacional.
Esperamos que o estudante adquira consciência matemática, ao invés de repetir
alguns “mecanismos” de procedimentos; os quais, via de regra, ele não sabe justificar
a razão de os estar fazendo, tampouco imagina porquê os faz.
Não esgotaremos os assuntos apresentados.
Esperamos que o estudante adquira condição de, por si, aprofundar seus conhecimentos e solidificar a conceituação desses assuntos, além de encontrar neste texto meio
de consulta rápida (após leitura criteriosa).
•C •V •A •Ṕ •T •Ṕ. 14 •Ú •S
Os temas apresentados nos dois primeiros capítulos não deverão constituir novidade para o estudante (a não ser o §2.11, provavelmente), dessa forma, nossa preocupação é uma exposição auto-suficiente e convenientemente alinhavada, incluindo
demonstração formal para as proposições apresentadas. As definições são redigidas de
modo a permitir eventuais extensões, objetivando maior generalização no escopo da
proposta deste curso. Os problemas ficam a cargo do leitor, justificando procedimentos
que já conhece e que ainda não os justificou ou provou.
Observamos que é cada vez mais raro o estudante que tenha tido acesso aos temas
aqui abordados a partir de um ponto de vista mais formal (tanto por textos quanto por
aulas), com rigor matemático aceitável. Tentamos suprir essa lacuna, buscando uma
abordagem original que desperte uma conceituação mais ampla, mesmo para aqueles
que já dominam formalmente cada um dos tópicos do curso.
Estaremos estudando inicialmente temas como: álgebra básica, trigonometria, exponenciais, logaritmos, funções hiperbólicas, etc. Os temas selecionados serão tratados com
bastante cuidado. Embora bastante elementar, destacamos, em particular, a demonstração da expressão geral da solução de uma equação do segundo grau (§1.4.3) e do
teorema de Pitágoras (§2.2).
Não obstante se pretenda seguir um raciocínio formal, no qual as definições e as
proposições determinam a “evolução” da teoria, não se deve desprezar (em momento
algum) o aspecto intuitivo dos conceitos envolvidos, a partir do qual as definições e as
proposições encontram suas origens.
O livro Teoria Ingênua dos Conjuntos, de Paul R. Halmos [11] influenciou-nos
muito; o prefácio desse texto termina com uma afirmativa marcante “...é realmente
•C •V •A •Ṕ •T •Ṕ. 15 •Ú •S
matéria bastante trivial, mas (...) você precisa um pouco dela, e aqui está; leia-a,
absorva-a e esqueça-a”. Esse final sintetiza bem o que significa ter entendido e ter
assimilado um assunto.
Afirmativa costumeira entre os estudantes que testaram este texto é que “a cada
leitura parece que o texto muda”; não! não é que o texto mude, o “entendimento do
leitor” é que está mudando, sua percepção, sua sensibilidade e maturidade para tratar
com o raciocínio formal.
Rio de Janeiro, dezembro de 1998
Não posso deixar de indicar que muito do material que consta neste trabalho foi preparado para as aulas de Mecânica Geral (I e II) que ministrei por alguns anos no Instituto
de Física da Universidade do Estado do Rio de Janeiro, embora não explicitamente
indicado aqui, estavam presentes no que eu chamava “pé de quadro”. Foram muitos
esses “pés de quadro” e creio que meus estudantes àquela época poderão reconhecer
muita dúvida e muita discussão havida em sala de aula.
Rio de Janeiro, dezembro de 2002
•C •V •A •Ṕ •T •Ṕ. 16 •Ú •S
Orientação para o estudante
Conforme mencionamos na apresentação, procuramos seguir um estilo formal: definindo, comentando, propondo propriedades e conseqüências, demonstrando-as sempre ou propondo a prova como problema. Temos percebido dificuldades iniciais por
parte dos estudantes com os quais experimentamos versões anteriores deste texto. Isso
é natural quando não se está habituado com textos formais, para aqueles que estudam
um texto desse tipo pela primeira vez. É importante que o estudante não esmoreça
e que adquira algum método para lê-lo com alguma produtividade. Realmente não
pensamos um texto para convencimento rápido e ilusório, tampouco adestrador, objetivamos um texto que convidasse o leitor para reflexão, que o provocasse para enquadrar
o que já conhece com o que está sendo exposto. Principalmente, pensamos fornecer
elementos (básicos e fundamentais) para o estudante substanciar suas próprias bases
teóricas em matemática, abstraindo e trazendo ao encontro do que ele já conhece e sabe
operar (mesmo ainda sem saber justificar ou criticar). Essas tais dificuldades motivaram
esta “orientação”.
Para sua própria orientação, folheie todo o texto antes de uma leitura detalhada; esta é uma maneira para perceber melhor a forma como o trabalho foi concebido e
organizado. No nosso caso específico, os dois primeiros capítulos constituem o objetivo
mínimo, os outros são complementares e seguem o mesmo estilo.
Leia cada seção do capítulo sem interrupção, não se importe com o que não estiver entendendo na primeira leitura; leia-o, não desista. Leia o parágrafo até o final,
depois o releia e prossiga com a leitura até o final do capítulo, depois o releia mais
•C •V •A •Ṕ •T •Ṕ. 17 •Ú •S
uma vez. Não se aprende à primeira leitura. Depois, já com um apanhado geral do
que está no parágrafo, retome a leitura pelo início do parágrafo (por parágrafo estamos
entendendo também os subparágrafos). Você observará aspectos que não observou na
primeira leitura, observará, ainda, entrelinhas que nem imaginava existirem, e elas
ficarão mais evidentes a cada nova leitura (crítica, é claro). Não esqueça de destacar e
identificar os conceitos já estudados que estão envolvidos no parágrafo; se não os tiver
assimilado, volte aos parágrafos nos quais foram definidos. Nesse sentido, procuramos
incluir um índice (remissivo, no final do volume) bastante cuidadoso, no qual algumas
aplicações e exemplos podem ser encontrados. Quando precisar de um exemplo e
não o encontrar no ponto em que estiver lendo, vá ao índice (remissivo) e procure
a palavra-chave do assunto ou tente localizar no que você já conhece um exemplo
correspondente. Empenhamo-nos detalhar o índice para a localização da ocorrência
de exemplos e aplicações. Uma exemplificação que nos ocorre é quanto o conceito
de isomorfismo, procuramos mapear no índice todas as ocorrências desse conceito no
texto.
Devemos chamar atenção que muitos problemas estão resolvidos ao longo do próprio texto sem a forma usual de enunciado e solução, quando identificado o problema
(pelo estudante ou por indicação no texto), convidamos o estudante a tentar resolvê-los
antes de os ler, esse é um ótimo exercício para ajudar a diagnosticar os pontos fracos e
a forma de “organizar” o raciocínio, ou melhor a linha de raciocínio.
Como regra geral, tente sempre enquadrar o que você está estudando (ou pensando)
no âmbito do seu conhecimento prévio ou atual. Depois, renove esse conhecimento.
•C •V •A •Ṕ •T •Ṕ. 18 •Ú •S
Notação empregada∗
Usamos a notação habitual da teoria dos conjuntos, em particular:
; – o ponto e vírgula « ; » denota tal que;
∀ – indica o quantificador para todo, qualquer que seja;
∃ – indica o quantificador existencial que significa existe;
⇒ – indica a relação de implicação lógica entre proposições;
⇔ – indica a relação de equivalência lógica entre proposições;
∗
A inclusão desta lista foi sugerida pelo Prof. Jader Benuzzi Martins.
•C •V •A •Ṕ •T •Ṕ. 19 •Ú •S
∈ , < – indicam: pertence, não pertence, isto é, a ∈ B significa: a é elemento do conjunto B;
⊂ – indica está contido, isto é, A ⊂ B significa: o conjunto A é subconjunto do conjunto B;
∩ – indica intersecção de conjuntos;
∪ – indica união de conjuntos;
∅ – indica o conjunto vazio;
[
– indica a reunião dos conjuntos A1 , A2 , . . . , An ;
P(X) – indica o conjunto das partes do conjunto X [pág. 28];
ClRa – indica a classe de equivalência associada ao elemento a por meio da
relação R [pág. 29];
A/R – indica o conjunto quociente do conjunto A em relação à relação R
[pág. 29];
f : A → B – denota a função f com domínio A e contradomínio B;
f −1 – denota a função f −1 : B → A, isto é, a função inversa da bijeção
f : A → B;
x 7→ f (x) – indica que a função f faz corresponder ao elemento x ∈ A o
elemento f (x) ∈ B;
f |X – indica a restrição de uma função f : A → B ao conjunto X ⊂ A
[pág. 33];
•C •V •A •Ṕ •T •Ṕ. 20 •Ú •S
f [X] – indica o conjunto imagem do conjunto X por meio da função f
[pág. 34];
g◦ f – indica a função composta de f : A → B e g : B → C [pág. 37];
f · g – indica a função produto de f : A → B e g : A → B [pág. 124];
~a · ~c – indica o produto escalar dos vetores ~a e ~c ;
~a × ~c – indica o produto vetorial dos vetores ~a e ~c ;
N – indica o conjunto dos números naturais;
Z – indica o conjunto dos números inteiros;
Q – indica o conjunto dos números racionais;
R – indica o conjunto dos números reais;
C – indica o conjunto dos números complexos;
1l – indica uma matriz identidade (quadrada) [pág. 96];
|x| – indica módulo de x [§1.4.6, pág. 88];
Cn – indica o conjunto das funções reais contínuas com a derivada de
ordem n bem definida no intervalo considerado;
≈ – indica aproximado, isto é, a ≈ b significa: a é aproximadamente
igual a b;
⊥ – indica perpendicularidade, isto é, α ⊥ β significa: α é perpendicular a β;
k – indica paralelismo, isto é, α k β significa: α é paralelo a β;
•C •V •A •Ṕ •T •Ṕ. 21 •Ú •S
Xb
P
– indica somatório, isto é, 4i=1 αi significa a soma de quatro parcei=a
las, ou seja, α1 +α2 +α3 +α4 ;
Yb
Q
– indica produtório, isto é, 4i=1 αi significa o produto de quatro
i=a
fatores, ou seja, α1 ×α2 ×α3 ×α4 ;
εi jk – indica o tensor anti-simétrico de Levi-Civita,
[eq. (4.68), pág. 317];
√
i – indica a unidade imaginária, i.e., i = −1.
In – indica o subconjunto dos números naturais tais que x ≤ n, ou seja,
é o conjunto In = {1, 2, . . . , n} ⊂ N;
cqd – é a abreviatura usual que se emprega no final de uma demonstração, significando “como queríamos demonstrar” (usa-se alternativamente a abreviatura q.e.d. da expressão latina: quod erat
demonstrandum), também se usa alternativamente ;
i.e. – é abreviatura da expressão latina id est e significa isto é.
•C •V •A •Ṕ •T •Ṕ. 22 •Ú •S
Parte I
Álgebra
•C •V •A •Ṕ •T •Ṕ. 23 •Ú •S
Capítulo 1
Tópicos de Álgebra
Iniciaremos esta série de “tópicos breves” com a álgebra.
Talvez seja oportuno algumas palavras sobre o que se entende por sistema algébrico:
um conjunto de objetos munidos de algumas operações (§1.2.5) para combiná-los.
Não nos ocuparemos da Teoria dos Conjuntos, mas, para um conjunto de conjuntos,
a reunião e a interseção de conjuntos ou, ainda, o produto cartesiano e o conjunto
diferença de dois conjuntos são exemplos de sistemas algébricos.
Certamente você já estudou tópicos como relação e função. Os próximos parágrafos
destinam-se a formalizar esses dois conceitos e suas principais propriedades. A razão
•C •V •A •Ṕ •T •Ṕ. 24 •Ú •S
de discuti-los aqui é dispor o leitor para raciocinar com propriedades fundamentais e
suas conseqüências lógicas.
1.1.
Relação
Nosso objetivo mais imediato é definir e estudar função (ver §1.2), porém, como função
é caso particular de relação, resolvemos principiar formalmente abordando relação.
Dados dois conjuntos não vazios A e B, chamamos1 relação a qualquer subconjunto
R do produto cartesiano A×B. Dessa forma, se a ∈ A e b ∈ B, e se (a, b) ∈ R, então dizemos
que a está relacionado com b por meio da relação R. Deve-se observar que não existe
nenhuma restrição para o conjunto R ⊂ A×B que define a relação. No caso em que R for
o conjunto vazio, i.e., quando R = ∅, dizemos que R é uma relação vazia. Se, em particular,
A = B, então dizemos que R é uma relação em A ou uma relação binária em A. Dada uma
relação R de A para B, ficam definidos dois conjuntos, a saber:2
n
o
domínio da relação R
D = n a ; a ∈ A e (a, b) ∈ Ro ,
E = b ; b ∈ B e (a, b) ∈ R ,
amplitude da relação R .
O conjunto D, chamado domínio da relação R, é formado por todos os elementos de
A que estão relacionados com algum elemento de B. Por outro lado, o conjunto E,
1
Estamos definindo formalmente o que se entende por relação.
Estaremos usando a notação R para denotar uma relação genérica, com o conjunto dos reais será denotado
por R.
2
•C •V •A •Ṕ •T •Ṕ. 25 •Ú •S
chamado amplitude da relação, é formado por todos os elementos de B que possuem
algum elemento de A a ele associado por meio de R.
Para a relação R entre A e B, é sempre possível definir a relação inversa, que será
denotada por R−1 , como sendo tal que:
n
o
R−1 = (b, a) ; (a, b) ∈ R .
Dada uma relação3 R em A algumas propriedades que podem ser relevantes são as
seguintes:
1. Reflexiva, se
(a, a) ∈ R
∀a ∈ A .
(a, a) < R
∀a ∈ A .
2. Anti-reflexiva, se
3. Simétrica, se (i.e., sempre que)
(a, b) ∈ R
⇒
(b, a) ∈ R .
4. Assimétrica, se (i.e., sempre que)
(a, b) ∈ R e
(b, a) ∈ R
⇒
a = b , i.e.,
portanto, se a relação R em A for assimétrica e (a, b) ∈ R com a , b, então
(b, a) < R.
3
Note-se que, conforme já definido anteriormente, uma relação em A é um subconjunto de A×A.
•C •V •A •Ṕ •T •Ṕ. 26 •Ú •S
5. Transitiva, se
(a, b) ∈ R e
(b, c) ∈ R
⇒
(a, c) ∈ R .
A relação de inclusão4 entre conjuntos exemplifica algumas dessas propriedades; com
efeito, seja X um conjunto cujos elementos são conjuntos, para A, B ∈ X, dizemos que
A ⊂ B se A for um subconjunto de B; uma relação de inclusão apresenta as seguintes
propriedades: reflexiva [A ⊂ A, seja qual for o conjunto A em X], assimétrica [A ⊂ B e B ⊂ A, então
A = B] e transitiva [A ⊂ B e B ⊂ C, então A ⊂ C].
1.1.1.
Relação de equivalência
Uma relação em A que seja reflexiva, simétrica e transitiva é chamada relação de equivalência5 ,
reflexiva
Relação de equivalência ⇔
simétrica
transitiva.
Sua importância reside no fato de a relação de igualdade num conjunto ser um tipo
especial de relação de equivalência. Um exemplo em física é dado pelo conceito de
4 Propriedade que possui um conjunto de ter todos os seus elementos contidos num outro conjunto.
(Houaiss)
5 Essa é a definição tradicional para relação de equivalência, embora a propriedade reflexiva seja dispensável, uma vez que uma relação que seja simétrica e transitiva também será reflexiva. Com efeito, se for
simétrica, então (a, b) ∈ R ⇒ (b, a) ∈ R, e se for transitiva, então (a, b), (b, c) ∈ R ⇒ (a, c) ∈ R, dessa forma, se
(x, y) ∈ R, a simetria implica (y, x) ∈ R e, daí, da transitividade (x, x) ∈ R, ou seja, é reflexiva.
•C •V •A •Ṕ •T •Ṕ. 27 •Ú •S
temperatura. Vejamos esse exemplo com mais detalhe. Alguns autores consideram a
chamada lei zero da termodinâmica que pode ser enunciada como:
Se dois sistemas termodinâmicos (S1 e S2 ) estão em equilíbrio termodinâmico com um terceiro (S3 ) quando em contato térmico, então eles estão em
equilíbrio termodinâmico entre si (quando cada par for levado ao contato
térmico).
Esse enunciado, além de encaminhar a definição do que se entende por temperatura6 , postula a possibilidade de construção de um aparelho para medir temperatura: o
termômetro. Essas duas possibilidades advêm justamente da relação de equivalência
definida no conjunto de todos os estados de equilíbrio termodinâmico de todos os
sistemas termodinâmicos que se está a considerar.
Alguns conceitos algébricos importantes, que encontramos com freqüência, são:
classe de equivalência e partição de um conjunto. Esses dois objetos matemáticos estão
intimamente relacionados e são fundamentais, uma vez que a relação de igualdade
é um caso particular de relação de equivalência e que, por sua vez, toda relação de
equivalência associa uma partição no conjunto sobre o qual está definido [ver Teorema 1.1.1, pág. 30]. Já que nos referimos a esses conceitos, vamos defini-los formalmente.
Dado um conjunto X, define-se o conjunto das partes, indicando-se por P(X), como o
conjunto cujos elementos são (todos) os subconjuntos de X, i.e.,
n
o
P(X) = A ; A ⊂ X .
6
Todos os sistemas termodinâmicos em estado de equilíbrio termodinâmico, que podem ser levados ao
contato térmico mantendo o mesmo estado de equilíbrio termodinâmico, possuem a mesma temperatura.
•C •V •A •Ṕ •T •Ṕ. 28 •Ú •S
Dessa forma: ∅ ∈ P(X), X ∈ P(X), ∅ ⊂ P(X) e7 X 1 P(X). Por exemplo:
n
o
X = {1, 2, 3} ⇔ P(X) = ∅, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}, X .
Uma partição de um conjunto X é um subconjunto Y de P(X) tal que
Ai ∩ A j = ∅ ou Ai = A j ∀Ai , A j ∈ Y e
S Ai = X
Ai ∈ Y ,
ou seja, os conjuntos de uma partição são dois a dois disjuntos e a sua reunião é o
próprio conjunto X. Agora, seja R uma relação de equivalência sobre X, e um elemento a
qualquer de X, fica bem definido o seguinte conjunto
n
o
ClRa = b ; a ∈ X e (a, b) ∈ R ,
ao qual chamamos classe de equivalência associado ao elemento a por meio da relação8
R. O conjunto formado pelas classes de equivalência de uma relação R sobre A, i.e., o
conjunto
n
o
A/R = ClRa ; a ∈ A ,
é chamado conjunto quociente de A relativamente a relação R. A grande importância
desses conceitos reside na seguinte proposição:
7 Note-se que os elementos de P(X) são conjuntos, todos os subconjuntos de X, não são os elementos do
conjunto X.
8 Omitiremos o super-índice R quando a relação estiver subentendida.
•C •V •A •Ṕ •T •Ṕ. 29 •Ú •S
Teorema 1.1.1. As classes de equivalência distintas de uma relação de equivalência sobre
A definem uma partição de A. Reciprocamente, dada uma partição de A, podemos
definir uma relação de equivalência sobre A, para a qual esses subconjuntos sejam
classes de equivalência distintas.
Prova. Seja uma relação de equivalência R sobre A. Como a relação é reflexiva, então
(a, a) ∈ R para todo a ∈ A; portanto a reunião de todas as classes de equivalência ClRa é
igual ao próprio conjunto A. Como a relação também é simétrica, se a, b ∈ A e Cla∩Clb , ∅,
então (a, b) ∈ R (e da simetria) (b, a) ∈ R, ou seja, Cla ⊂ Clb e Clb ⊂ Cla , então9 Cla = Clb ,
por outro lado, se Cla ∩Clb = ∅, então (a, b) < R e (b, a) < R. Fica provado, portanto, que
as classes de equivalência distintas são mutuamente disjuntas e que a sua reunião é o
próprio conjunto A, ou seja, que é uma partição definida em A. A demonstração da
primeira parte da proposição está completa, falta a da outra metade. Suponhamos que
{Aα ; Aα ⊂ A} seja uma partição de A. Dessa forma: todo elemento de A é elemento de
um único elemento dessa partição, portanto podemos definir uma relação R0 tal que:
(a, b) ∈ R0 se a e b são elementos de um mesmo Ai , resta apenas provar que R0 é uma
relação de equivalência. Com efeito: (i) como (a reunião) ∪Aα = A e os conjuntos Aα são
dois a dois disjuntos, então a ∈ A é elemento de um único conjunto Aα e, como se trata
de um elemento de uma partição de A, esse conjunto é único, assim, da definição de
R0 , segue-se que (a, a) ∈ R0 ∀a ∈ A (R0 é reflexiva); (ii) se a, b ∈ Aα , então, pela definição de
R0 , tem-se que (a, b) ∈ R0 e (b, a) ∈ R0 (R0 é simétrica) e (iii) se (a, b) ∈ R0 e (b, c) ∈ R0 , então
a, b, c ∈ Aα e, daí, (a, c) ∈ R0 (R0 é transitiva).
9
Essa é a definição de igualdade entre conjuntos, A ⊂ B e B ⊂ A ⇔ A = B.
•C •V •A •Ṕ •T •Ṕ. 30 •Ú •S
A relação de igualdade definida num conjunto é justamente a relação de equivalência definida nesse conjunto, cujas classes de equivalência contêm apenas um único elemento!
Essa observação acena para a possibilidade de identificarmos um elemento de um
conjunto por meio da interseção de partições distintas (i.e., de classes de equivalência
definidas a partir de relações de equivalência distintas).
Figura 1.1: Sistema de coordenadas polares.
•C •V •A •Ṕ •T •Ṕ. 31 •Ú •S
Um exemplo de relação de equivalência definida com base em uma partição é
a que ocorre quando usamos um sistema de coordenadas, exemplificaremos com as
coordenadas polares no plano (Fig. 1.1). A coordenada radial r define uma partição
do plano em subconjuntos formados por circunferências de círculos concêntricos, por
outro lado, a coordenada angular θ define outra partição formada por semi-retas que
passam pelo centro comum dos círculos. Dessa forma, a informação r = a localiza o
ponto sobre uma circunferência de círculo de raio a e a informação θ = b localiza o
ponto sobre a semi-reta que forma um ângulo b em relação a um eixo coordenado. A
interseção dessa semi-reta com a circunferência de círculo localiza justamente um único
ponto! (§4.1). Usa-se indicar (a, b) ∈ R por a ∼ b.
1.2.
Função
Uma função é caso particular de relação. Formalmente:
Sejam dois conjuntos não-vazios A e B, uma função f com domínio A e
contradomínio B é uma relação de A em B tal que: todo elemento de A possui
correspondente em B e esse correspondente é único, i.e., ∀a ∈ A ∃b ∈ B tal que
(a, b) ∈ f e, se (a, b) ∈ f e (a, c) ∈ f , então b = c.
É importante observar que uma função é composta por: um domínio, um contradomínio e por uma lei de correspondência que segue a regra anterior. Mudado qualquer
•C •V •A •Ṕ •T •Ṕ. 32 •Ú •S
um dos três itens, tem-se outra função. Essa afirmação pode estar parecendo pedante,
porém, por exemplo, quando se estuda das chamadas funções de Green, percebe-se que
alterando o domínio ou o contradomínio de uma função a sua função de Green correspondente passa a ser outra. Além disso, para que se tenha numa relação uma função,
basta que duas regras sejam sempre respeitadas, sem exceções: (1) todo elemento do
domínio deve ter um correspondente e (2) esse correspondente deve ser único.
Usa-se f : A → B para indicar a função f , com domínio A e contradomínio B. Os
termos aplicação e transformação de A em B são usados como sinônimos para função.
Quando A e B estão implícitos diz-se apenas “ função f ”, mas o domínio e o contradomínio devem ficar sempre bem entendidos. Denota-se ainda x 7→ f (x) para indicar
que f : A → B faz corresponder o elemento x ∈ A ao elemento y = f (x) ∈ B. Por exemplo:
f : R → R tal que x 7→ x2 = f (x).
Dadas duas funções f : A → B e g : A0 → B0 , essas funções serão iguais se (e somente
se) A = A0 , B = B0 e f (x) = g(x) para todo x ∈ A, i.e.,
f : A → B = g : A0 → B0 ⇔ A = A0 , B = B0 e f (x) = g(x) ∀x ∈ A .
Considere a função f : A → B e o conjunto X ⊂ A; f X : X → B denotará a função
cujo domínio é X ⊂ A, o contradomínio é o próprio conjunto B e f X (x) = f (x) ∀x ∈ X.
Chama-se f X de restrição de f à X. No caso em que A ⊂ X, então dizemos que a função
g : X → B é uma
extensão da função f : A → B se g(x) = f (x) para todo x ∈ A, é claro que
(nesse caso) gA = f : A → B, além disso, existe uma infinidade de extensões de uma
função.
•C •V •A •Ṕ •T •Ṕ. 33 •Ú •S
1.2.1.
Conjunto imagem
Dada uma função f : A → B e dado o conjunto X ⊂ A, define-se o conjunto imagem de X
(pela função f ), como sendo o conjunto:
f [X] = y ∈ B ; y = f (x) , x ∈ A ,
dessa forma, f [A] é o subconjunto de B que contém todos os elementos de B que
correspondem a algum x ∈ A por meio da função f . Usam chamar f [A] de imagem da
função (ou conjunto imagem da função) f .
Um contra-exemplo para o conceito de função seria a expressão f : R → R tal que
f (x) = 1/x, observe que isso não traduz uma função com domínio em R, uma vez que ao
elemento 0 ∈ R não corresponde nenhum real pela correspondência x 7→ 1/x. Você já deve
ter visto várias vezes a expressão f (x) = 1/x tratada como uma função, não se preocupe,
o único erro estaria em explicitar um domínio não conveniente, convenciona-se sempre
que, quando se considera um conjunto de funções em que o domínio está implícito, o
domínio a se considerar é o maior conjunto para o qual a relação seja uma função, essa
convenção é geralmente chamada de regra do domínio máximo. Dessa forma, indicar
apenas f (x) = 1/x, tendo os reais como conjunto implícito, significa estar considerado
R−{0} como domínio.
1.2.2.
Injeção, sobrejeção e bijeção
Listamos a seguir alguns exemplos de função:
•C •V •A •Ṕ •T •Ṕ. 34 •Ú •S
. a função IA : A → A, tal que IA (x) = x para todo x ∈ A, é chamada função identidade
em A;
. dados dois conjuntos (não-vazios), podemos considerar as seguintes funções:
π1 : A×B → A tais que π1 (a, b) = a para todo (a, b) ∈ A×B e
π2 : A×B → B tais que π2 (a, b) = b para todo (a, b) ∈ A×B ,
as quais podem ser chamadas, respectivamente, de primeira e segunda projeção;
. uma função λ : A → B tal que λ(x) = b para todo x ∈ A pode ser chamada de uma
função constante ou inclusão.
Definiremos a seguir alguns tipos de função de particular interesse: dada uma
função f : A → B, dizemos que:
. f é uma sobrejeção ou uma função sobrejetiva se f [A] = B, i.e., se dado qualquer
b ∈ B, existe um elemento a de A tal que b = f (a), ou seja, se todo elemento do
contradomínio é imagem de pelo menos um elemento do domínio;
. f é uma injeção ou uma função injetiva se f (a) = f (b) implica a = b, qualquer que seja
a ∈ A, i.e., quaisquer que sejam a, b ∈ A, a , b implica f (a) , f (b), ou ainda, se cada
elemento do contradomínio é imagem de um único elemento do domínio10 ;
10
Observe que para uma injeção f qualquer, sempre que ocorre f (a) = f (b), pode-se afirmar que a = b.
•C •V •A •Ṕ •T •Ṕ. 35 •Ú •S
. f é uma bijeção (ou uma função biunívoca) se a função for injetiva e sobrejetiva.11
Dada uma relação, está sempre definida a sua relação inversa; quando de uma
função f : A → B, a relação inversa pode não ser uma função (mas sempre será uma
relação). Vejamos:
– se f não for sobrejetiva, a relação inversa não será uma função porque sempre
haverá (pelo menos) um elemento de B que não possuirá correspondente pela
relação inversa;
– se f não for injetiva, então a relação inversa não será uma função porque
sempre haverá (pelo menos) um elemento de B que possuirá mais de um
correspondente por meio da relação inversa;
– por outro lado, se f for uma bijeção, então, pelo seu aspecto sobrejetor, todo
elemento de B possui correspondente pela relação inversa e, pelo seu aspecto
injetivo, esse correspondente é único; dessa forma, a uma bijeção sempre está
associada uma relação cuja relação inversa também é uma função, e mais:
essa função (inversa) também é uma bijeção.
Dada uma bijeção f : A → B, a sua função inversa é a função12
f −1 : B → A tal que ∀b ∈ B, f −1 (b) = a , quando f (a) = b .
11 Um exemplo da importância de uma bijeção está na enumeração ou na contagem dos elementos de um
conjunto (enumerável), o ato de contagem significa justamente estabelecer uma bijeção entre elementos do
conjunto e um subconjunto dos números naturais.
12 Não se deve confundir essa notação com a notação exponencial para o inverso multiplicativo, i.e., f −1 (x) ,
1/f (x); por outro lado, [ f (x)]−1 = 1/f (x).
•C •V •A •Ṕ •T •Ṕ. 36 •Ú •S
É interessante observar que é sempre possível obter uma bijeção a partir de uma
injeção, com efeito: seja uma injeção f :A → B, é fácil verificar que a função g:A → f [A]
tal que g(a) = f (a) para todo a ∈ A é uma bijeção; por esse motivo, quando se pretende
definir uma bijeção, é recomendável iniciar definindo uma injeção13 .
1.2.3.
Composição de funções
Dadas duas funções f : A → B e g : B → C, definimos a função composta:
g ◦ f : A → C tal que (g ◦ f )(x) = g ◦ f (x) = g( f (x)) ∀x ∈ A .
(1.1)
Observe que g ◦ f “opera” da direita para a esquerda e que o domínio da função à
esquerda (g) deve ser igual ao contradomínio da função à direita ( f ) ou, no caso mais
geral, a imagem f [A] deve estar contida no domínio da função g; do contrário, a relação
não seria uma função.
Teorema 1.2.1. A composição de funções é associativa, i.e., dadas as funções f : A → B,
g : B → C e h : C → D, vale:
h ◦ g ◦ f (x) = h ◦ g ◦ f (x)
∀x ∈ A .
13
Restrições que sejam injeções e o procedimento anterior traduzem a forma mais eficiente para se definir a
“função inversa” de uma função não-bijetiva; como é o caso das funções trigonométricas (§2.7), por exemplo.
•C •V •A •Ṕ •T •Ṕ. 37 •Ú •S
Prova. Com efeito, para todo x ∈ A:14
h ◦ g ◦ f (x) = h(g ◦ f (x))
= h(g( f (x)))
= (h ◦ g )( f (x))
= h ◦ g ◦ f (x)
Teorema 1.2.2. Dadas duas funções f : A → B e g : B → C:
1. se f e g são injetivas, então a composta g◦ f também é injetiva;
2. se f e g são sobrejetivas, então a composta g◦ f também é sobrejetiva;
3. se f e g são bijetivas, então a composta g◦ f também é bijetiva.
Prova. Se f e g são funções injetivas, então g◦ f (a) = g◦ f (b) significa que g( f (a)) = g( f (b));
como g é injetiva, então f (a) = f (b) e, finalmente, como f também é injetiva, então a = b
para qualquer a ∈ A, o que demonstra o primeiro item da proposição. A demonstração
dos outros itens fica como problema proposto.
1.2.4.
Função inversa
Consideremos duas funções f : A → B e g : B → A, dizemos que g é uma inversa à esquerda
para f se ocorre: g◦ f = IA : A → A, i.e., g( f (x)) = x para todo x ∈ A. Por outro lado, dizemos
14
Observe que estaremos usando apenas a relação (1.1) que define a composição de funções.
•C •V •A •Ṕ •T •Ṕ. 38 •Ú •S
que g é uma inversa à direita para f quando f ◦g = IB : B → B, i.e., f (g(x)) = x para todo x ∈ B.
Teorema 1.2.3. Uma função f : A → B possui inversa à esquerda se, e somente se, for
injetiva.
Prova. Demonstraremos as duas partes da proposição em separado:
1. dada f : A → B, seja a relação R = {( f (a), a) ; a ∈ A e f : A → B}, então todo elemento
de f [A] possui imagem por R e, sendo f injetiva, essa imagem é única; portanto
a relação R é uma função g : f [A] → A tal que g( f (a)) = a para todo a ∈ A, i.e., g é a
função inversa à esquerda de f ;
2. se existe g : f [A] → A tal que g◦ f = IA para todo a ∈ A, então, se f não fosse injetiva,
para a relação R = {( f (a), a); a ∈ A e f : A → B} existiriam pelo menos dois elementos
distintos b1 e b2 em f [A] tais que ( f (b1 ), b1 ) ∈ R e ( f (b2 ), b1 ) ∈ R, o que contrariaria a
hipótese de g ser uma função.
O que completa a demonstração.
Teorema 1.2.4. Uma função f : A → B possui inversa à direita se, e somente se, for
sobrejetiva.
Prova.
1. se existe g : B → A tal que f ◦ g = IB , então ( f ◦ g)[B] = IB [B] = B, portanto, f [g[B]] = B
e f é sobrejetiva;
•C •V •A •Ṕ •T •Ṕ. 39 •Ú •S
2. se f : A → B é sobrejetiva, então a relação {( f (a), a); a ∈ A} é tal que todo elemento de
B possui imagem, logo podemos escolher uma sub-relação R0 tal que se (x, a) ∈ R0
e (y, a) ∈ R0 ⇒ x = y; dessa forma, R0 é uma função g : B → A tal que f ◦ g = IB , i.e., se
f for sobrejetiva, então existe a inversa à direita.
o que completa a demonstração do Teorema 1.2.4.
Observe-se ainda: se f : A → B for uma bijeção, então a sua função inversa f −1 é tal
que
f −1 ◦ f = IA : A → A e que f ◦ f −1 = IB : B → B ,
ou seja15 , f −1 é inversa à direita e à esquerda para f .
15 Em parágrafo próximo (§1.2.5), estudaremos as principais propriedades que podem ocorrer em uma
operação. Conforme veremos, a composição de funções é uma operação definida em um conjunto conveniente
de funções, dessa forma, esta é uma boa oportunidade para usar a composição de funções como exemplo
abstrato. A composição de funções não é necessariamente comutativa, para mostrar a não comutatividade
basta mostrar um exemplo [é sempre uma tarefa mais complexa provar que uma propriedade é válida do
que provar que não é válida, quando basta exibir um único caso para o qual a referida propriedade não é
verificada], consideremos duas funções reais, por exemplo f (x) = x+2 e g(x) = kx2 +`; nesse caso:
g ◦ f (x) = g(x + 2) = k(x + 2)2 + ` ,
enquanto
f ◦ g(x) = f (kx2 + `) = kx2 + ` + 2 ,
portanto
g ◦ f (x) − f ◦ g(x) = 4kx + 4k − 2 , 0 .
Por outro lado, considerando a função real f : A → B, tal que f (x) = x2 : se A = R, a função f não admitirá
inversa à esquerda, por não ser injetiva, mesmo para B = R+ , quando será sobrejetiva; se B = R, a função f não
admitirá inversa à direita, por não ser sobrejetiva; mas se A = R+ , f admitirá a função ge : R+ → R+ , tal que
•C •V •A •Ṕ •T •Ṕ. 40 •Ú •S
1.2.5.
Operações
Seja um conjunto M (não-vazio) e dois conjuntos A, B ⊆ M. Entendemos por uma
operação (binária) em M uma função f : A×B → M. De modo geral, denotarmos:
f (a, b) = c
⇔
a ? b = c,
a qual, no caso em que A = B, será referida abreviadamente por “ operação ? ”. Dizemos
que a operação ? é fechada (em A) se f [A×A] ⊆ A. A definição que estamos adotando
inclui a possibilidade de considerarmos como uma operação, por exemplo, a multiplicação de matrizes retangulares; mais especificamente, considere M como o conjunto
formado pelas matrizes com elementos reais, A como o conjunto das matrizes reais 5×3
e B o das 3×2, sendo f a multiplicação dessas matrizes, então f [A×B] é o conjunto das
matrizes 5×2. Não estamos restringindo o objeto de nosso estudo a esse conjunto de matrizes, usamos como um meio para exemplificar alguns aspectos, tais como: elemento
neutro lateral e inverso multiplicativo, que veremos adiante. Listaremos a definição
das principais propriedades que podem ocorrer numa operação ? num conjunto M,
i.e., f : A×B → M tal que A, B ⊆ M; os exemplos de propriedades que daremos se referem
ao produto de matrizes, onde A é formado pelas matrizes `×m e B por m×n.
√
√
ge (x) = + x, como inversa à esquerda; se A = B = R+ , f admitirá a função gd : R+ → R+ , tal que gd (x) = + x,
−1
como inversa à direita e, além disso, ge = gd = f .
•C •V •A •Ṕ •T •Ṕ. 41 •Ú •S
1.2.6.
Principais propriedades
que podem ocorrer em operações
Comutatividade.
Se A = B, uma operação ? é comutativa se16 f (a, b) = f (b, a), quaisquer que sejam a
e b em A, i.e., se a?b = b?a ∀a, b ∈ A. 17
Associatividade.
Quando M = A = B, dizemos que uma operação ? é associativa se (e somente se)
f (a, f (b, c)) = f ( f (a, b), c) ,
quaisquer que sejam a, b e c em A, i.e., se a?(b?c) = (a?b)?c ∀a, b, c ∈ A. 18
Elemento neutro à esquerda.
Diz-se que ee ∈ A é um elemento neutro à esquerda para a operação ? se (e somente
se) f (ee , b) = b, qualquer que seja b ∈ B, i.e., ee ? b = b ∀b ∈ B. 19
Elemento neutro à direita.
Diz-se que ed ∈ B é um elemento neutro à direita para a operação ? se (e somente se)
16
Toda definição é “se e somente se”, por brevidade, costuma-se redigir apenas “se”.
O produto entre matrizes e a composição de funções não são comutativas.
18 O produto de duas matrizes será associativo quando as matrizes forem quadradas e da mesma ordem,
por exemplo.
19 O produto de matrizes possuirá elemento neutro à esquerda apenas se A for formado por matrizes
quadradas, por exemplo.
17
•C •V •A •Ṕ •T •Ṕ. 42 •Ú •S
f (a, ed ) = a, qualquer que seja a ∈ A, i.e., a?ed = a ∀a ∈ A. 20
Elemento neutro.
Diz-se que e ∈ A ∩ B é um elemento neutro21 para a operação ? se, e somente se,
f (e, b) = b e f (a, e) = a, quaisquer que sejam a ∈ A e b ∈ B, i.e.,
e?b=b
e
a?e=a
∀(a, b) ∈ A × B ,
ou seja, se for, simultaneamente, elemento neutro à esquerda e à direita. 22
Simétrico à esquerda.
Se ed ∈ B é um elemento neutro à direita de ?, dizemos que `a é um simétrico à
esquerda de a ∈ B quando `a ?a = ed . 23
Simétrico à direita.
Se ee ∈ A é um elemento neutro á esquerda de ?, dizemos que da é um simétrico à
direita de a ∈ A quando a?da = ee .
Simétrico.
Quando A = B, se e ∈ A é um elemento neutro de ?, dizemos que sa é um simétrico
20 O produto de matrizes possuirá elemento neutro à direita apenas se B for formado por matrizes quadradas
ou se B for o conjunto das matrizes reais n×m e A o das matrizes n×n, para n fixo e m ∈ N.
21 Essa notação, para o elemento neutro de uma operação, não deve ser confundida com a base dos
logaritmos naturais (§2.10.3, eq. (2.28), pág. 184).
22 O produto de matrizes possuirá elemento neutro apenas se A e B forem formados por matrizes quadradas
da mesma ordem.
23 O produto de matrizes possuirá elemento neutro à direita se A for de ordem n×n e B de ordem n×m,
com n fixo e m ∈ N.
•C •V •A •Ṕ •T •Ṕ. 43 •Ú •S
de a ∈ A quando a?sa = sa ?a = e, i.e., se sa for simétrico à direita e à esquerda de a. 24
1.2.7.
Conseqüências das propriedades
fundamentais de uma operação
Algumas propriedades gerais (muito importantes) que podem ocorrer em uma operação, serão enunciadas e demonstradas. As proposições abaixo não estão restritas a
qualquer operação em particular, reforçamos esta observação denotando as operações
de modo genérico. De qualquer forma, uma proposição está sempre restrita à suas
hipóteses.
Teorema 1.2.5. Dada a operação ? definida pela função f : A × A → A, se ee for um
elemento neutro à esquerda e ed um elemento neutro à direita, então ee = ed .
Prova. Por hipótese, para todo a ∈ A,
ee ? a = a
a ? ed = a
Portanto: ee = ed .
⇒
⇒
ee ? ed = ed
ee ? ed = ee .
24
Só há possibilidade de uma matriz possuir simétrico multiplicativo se for quadrada, mesmo assim,
apenas aquelas cujo determinante não seja nulo.
•C •V •A •Ṕ •T •Ṕ. 44 •Ú •S
Teorema 1.2.6. Se e ∈ A for um elemento neutro de uma operação ? em25 A, então (para
essa operação) e será o único elemento de A com essa propriedade.
Prova. Por hipótese o elemento e é tanto elemento neutro à esquerda quanto à direita,
dessa forma, consideremos que tenhamos dois elementos com essa propriedade: e1 e
e2 ; como, para todo a ∈ A, temos:
e1 ? a = a ? e1 = a
e2 ? a = a ? e2 = a
Portanto, e1 = e2 .
⇒
e1 ? e2 = e2 ? e1 = e2
e2 ? e1 = e1 ? e2 = e1
Teorema 1.2.7. Se a operação ? definida pela função f : A × A → A possui elemento
neutro e, então e possui simétrico e0 (em A) e e0 = e.
Prova. Se e ∈ A for elemento neutro de ?, então e ? a = a ? e = a para todo a ∈ A; em
particular, para a = e, valerá a identidade e ? e = e ? e = e; logo, existirá e0 ∈ A tal que
e?e0 = e0 ?e = e e, em particular, e0 = e.
Teorema 1.2.8. Seja o conjunto A (que possui mais de um elemento26 ) e uma operação ? definida pela função f : A×A → A. Se ? possui elemento neutro e ∈ A e se existe
25
Definida por uma função f : A×A → A.
Para um conjunto que contém um único elemento, é possível definir apenas uma operação, a saber:
A = {a} e (a, a) 7→ a, nesse caso a é igual ao elemento neutro da operação e igual ao próprio simétrico.
26
•C •V •A •Ṕ •T •Ṕ. 45 •Ú •S
u ∈ A−{e} tal que27
u?a=a?u=u
∀a ∈ A ,
(1.2)
então está indeterminado (ou não está definido) o elemento simétrico de u (para ?), i.e.,
o elemento u0 ∈ A tal que
u0 ? u = u ? u0 = e .
Além disso, se existe um elemento u ∈ A−{e} com a propriedade (1.2), ele é único28 .
Prova. Suponhamos que exista u0 tal que u , e e u?u0 = u0 ?u = e, então a condição
u ? a = a ? u = u ∀a ∈ A
⇒
u=e,
o que contraria a hipótese u , e. Isso conclui (por negação) a demonstração da primeira
parte da proposição. Para provar a unicidade de u, sejam u1 e u2 tais que, ∀a ∈ A
u1 ? a = a ? u1 = u1
u2 ? a = a ? u2 = u2 ,
daí (considerando a = u2 e a = u1 , na primeira e na segunda equação)
u1 ? u2 = u2 ? u1 = u1
u2 ? u1 = u1 ? u2 = u2 ,
portanto u1 = u2 .
27
28
Lembre-se da multiplicação sobre os reais e do zero.
Essa propriedade justifica o axioma C.7 de corpo, ver §1.4, pág. 70.
•C •V •A •Ṕ •T •Ṕ. 46 •Ú •S
É oportuno destacar que as proposições anteriores independem das operações serem
ou não serem comutativas ou associativas.
Teorema 1.2.9. Se a operação ?, definida pela função f : A×A → A, é associativa e se `a
é um simétrico à esquerda e da é um simétrico à direita do elemento a ∈ A, então (para
essa operação) `a = da .
Prova. Da hipótese dos simétricos temos: a?da = ee e `a ?a = ed , como a operação possui
elemento neutro à esquerda e à direita, então (pelo Teorema 1.2.6) ee = ed = e. Portanto
a ? da
`a ? a
=e
=e
⇒
e = a ? da
⇒
`a ? e = `a ? (a ? da ) ,
finalmente, como por hipótese a operação é associativa,
`a = (`a ? a) ? da
= e ? da
= da .
O que completa a demonstração.
Observa-se que as Proposições 1.2.5–1.2.9 são válidas independentemente da operação ser ou não ser comutativa.
•C •V •A •Ṕ •T •Ṕ. 47 •Ú •S
1.2.8.
Homomorfismo, isomorfismo e automorfismo
Sejam dois conjuntos, A e B, e duas operações (distintas), ? e •, definidas pelas funções
f : A × A → A e g : B × B → B. Chamamos de homomorfismo a uma função h : A → B
tal que h( f (a1 , a2 )) = g(h(a1 ), h(a2 )) ∀a1 , a2 ∈ A , ou, equivalentemente, em termos da notação
operacional:
h(a1 ? a2 ) = h(a1 ) • h(a2 )
∀a1 , a2 ∈ A .
Um homomorfismo que seja uma bijeção é chamado isomorfismo. Usa-se também
chamar de automorfismo a um isomorfismo h : A → A, envolvendo um mesmo conjunto,
quando f e g definem operações distintas. Se existe um isomorfismo entre A, munido
da operação f , i.e., (A, f ), e B, munido da operação g, i.e., (B, g), então dizemos que
(A, ?) e (B, •) são isomorfos.
Falar em homomorfismo (isomorfismo), pressupõe sempre uma função (bijeção)
envolvendo conjuntos onde se consideram operações bem definidas.
O conceito de isomorfismo é extremamente útil e largamente empregado em física,
estando intimamente relacionado com as possíveis formas de se representar uma determinada situação física ou um determinado modelo para um sistema físico ou, ainda,
de uma grandeza física. Esse aspecto é particularmente útil para o entendimento (e
utilização) de grandezas matemáticas muito importantes em física, como, por exemplo,
escalares, vetores ou (de modo mais amplo) tensores; esses são “objetos” que independem
do sistema de coordenadas que se adota, daí a sua importância intrínseca em física. Afinal, qualquer lei física que se preze (i.e., que seja aplicável aos fenômenos naturais) não
pode depender do sistema de coordenadas que se adote (no referencial considerado).
Essa característica é tão fundamental que se constitui num dos postulados (geralmente
•C •V •A •Ṕ •T •Ṕ. 48 •Ú •S
adotado implicitamente) da física (ver [7], [28] e [21]). Observe que, face a um isomorfismo: tanto faz operar em (A, ?) ou em (B, •) que o resultado sempre pode ser obtido
através do isomorfismo ou da sua função inversa.
Daremos um exemplo usando a cinemática de uma partícula que se movimenta sobre uma curva previamente conhecida. É claro que, usando o conceito de partícula, já
procedemos a um modelo (considerando o sistema como um ponto material e um dispositivo de suporte como uma curva geométrica unidimensional) e no contexto desse
modelo o conjunto mais imediato é formado pelos pontos que constituem a curva geométrica. Nesse conjunto definimos uma operação, a operação “deslocamento sobre a
curva”. Para viabilizar um tratamento numérico, lança-se mão inicialmente de um homomorfismo, nominalmente: escolhendo um ponto qualquer da curva, uma unidade
de comprimento sobre a curva e um sentido positivo (sobre a curva), estabelecemos
uma injeção entre os pontos da curva e os números reais de tal maneira que a álgebra
dos deslocamentos sobre a curva seja traduzida na álgebra dos números reais (por meio
da operação de diferença nos reais). Se consideramos uma restrição no contradomínio
desse homomorfismo, obtemos um isomorfismo entre os pontos da curva e um subconjunto conveniente dos números reais, de tal forma que, mediante o isomorfismo,
estaremos em condições de fazer corresponder reais a pontos da curva (por meio da
função inversa) e cada número real a um deslocamento.
•C •V •A •Ṕ •T •Ṕ. 49 •Ú •S
1.3.
Grupo
Neste parágrafo, estudaremos os fundamentos da estrutura algébrica de grupo; assunto que tem origem em trabalhos desenvolvidos por Lagrange 29 . Vários objetos
importantes em física possuem estrutura algébrica de grupo, por exemplo: as rotações,
as simetrias cristalinas, etc. Mas vamos a uma definição formal (e abstrata).
1.3.1.
Axiomas de grupo
Dados um conjunto M, um subconjunto A contido em M e uma operação •, definida
pela função f : A×A → M, diremos que essa estrutura algébrica é um grupo (A, •) se são
satisfeitos chamados axiomas de grupo:
G.1 for fechada30 , i.e., se a • b ∈ A ∀a, b ∈ A ;
G.2 for associativa, i.e., se (a • b) • c = a • (b • c) ∀a, b, c ∈ A ;
G.3 possui elemento neutro, i.e., se ∃e ∈ A tal que e • a = a • e = a ∀a ∈ A ;
29 Lagrange desenvolveu uma das mecânicas mais abrangentes até hoje estabelecidas, certamente você
ouvirá falar muito em mecânica de Lagrange, em lagrangiana, em densidade de lagrangiana.
30 Sendo M e A ⊂ M dois conjuntos e dada a operação f : M×M → M, dizemos que a restrição
g : A×A → M = f |A×A : M×M → M
é uma operação fechada se, e somente se, g[A×A] ⊂ A. Com base nessa definição, toda operação definida num
conjunto (como definida no §1.2.5) é fechada.
•C •V •A •Ṕ •T •Ṕ. 50 •Ú •S
G.4 todo elemento de A possui elemento simétrico, i.e., se
∀a ∈ A , ∃a0 ∈ A ; a • a0 = a0 • a = e .
A definição que estamos adotando difere um pouco da mais usual apenas pelo
item G.1, que trata de a operação ser fechada. Justificamos esse procedimento, definindo
o que se entende por um subgrupo. Dado um grupo
(A, •) e um subconjunto B ⊂ A, dizse que (B, •) é um subgrupo de (A, •) se a operação f B×B : A×A → M (i.e., a restrição de f a
B) também for um grupo (sobre B). Se não tivéssemos incluído o item G.1, deveríamos
incluir na definição de subgrupo a cláusula de fechamento. Não há qualquer mudança
significativa, apenas uma “economia de palavras” nas redações futuras.
Como estamos dizendo que (B, •), subgrupo de (A, •), deve ser um grupo, então,
necessariamente:
1. B , ∅;
2. a operação induzida é fechada em B;
3. o elemento neutro de (A, •) também é elemento neutro de B e
4. todo elemento de B possui simétrico em B com relação a “operação •” induzida
em B.
Como a operação num grupo é associativa, então o elemento neutro é único, bem
como todo elemento possui inverso único, conforme foi demonstrado nos Teoremas 1.2.6
e 1.2.7. Uma proposição importante e de fácil demonstração é a que dá uma condição
necessária e suficiente para que um subconjunto B de A tenha uma estrutura de grupo
como uma restrição da função que define a operação do grupo (A, •).
•C •V •A •Ṕ •T •Ṕ. 51 •Ú •S
Teorema 1.3.1. Um subconjunto não vazio B de A é um subgrupo do grupo (A, •) se, e
somente se, x• y0 ∈ B ∀x, y ∈ B.
Prova.
1 da associatividade: se x, y, z ∈ B ⊂ A, então (x•y)• z = x•(y•z) pela própria operação
do grupo (A, •);
2 do elemento neutro: se x • y0 ∈ B ∀x, y ∈ B ⇒ x • x0 ∈ B ⇒ e ∈ B.
3 elemento inverso: como e ∈ B ⇒ e • y0 ∈ B ∀y ∈ B ⇒ y0 ∈ B ∀y ∈ B, i.e., todo
elemento de B possui inverso em B pela operação do grupo (A, •).
Para um grupo qualquer, temos ainda:
Teorema 1.3.2. Num grupo (A, •), as equações x•a = b e a•y = b possuem soluções únicas
para x e para y, para cada a, b ∈ A.
Prova. Como (A, •) é um grupo, então todo elemento de A possui simétrico em A, daí:
1. x•a = b ⇒ (x•a)•a0 = b•a0 ⇒ x•(a•a0 ) = b•a0 ⇒ x•e = b•a0 , portanto: x = b • a0 ;
2. a• y = b ⇒ a0 •(a• y) = a0 •b ⇒ (a0 •a)• y = a0 •b ⇒ e• y = a0 •b, portanto: y = a0 • b.
Uma vez que x = f (b, a0 ) e y = f (a0 , b), então, como se trata de uma função31 , segue-se a
unicidade de x e a de y.
31
Dessa forma, dado α, β ∈ A, f (α, β) é único.
•C •V •A •Ṕ •T •Ṕ. 52 •Ú •S
Deve-se observar que a demonstração da proposição anterior indica a solução das
referidas equações. Neste ponto poderíamos enunciar um corolário, já demonstrado,
envolvendo tais soluções.
Teorema 1.3.3 (lei do corte à esquerda).
Qualquer que seja o grupo (A, •), quaisquer que sejam a, b, c ∈ A, vale (a lei do corte à
esquerda):
a•b=a•c ⇒ b=c.
Prova. De a•b = a•c, tira-se a0 •(a•b) = a0 •(a•c), dessa forma:
(a0 • a) • b = (a0 • a) • c
⇒
e•b=e•c,
⇒
b=c .
Teorema 1.3.4 (lei do corte à direita). Qualquer que seja o grupo (A, •), quaisquer que
sejam a, b, c ∈ A, vale (a lei do corte à direita):
a•b=c•b
⇒
a=c.
Prova. A prova é análoga à do teorema anterior, sendo deixada como problema.
Por esses dois teoremas anteriores, fica visto que vale a lei do corte, tanto à esquerda
quanto à direita (e nesse sentido será referida apenas como lei do corte), independentemente da operação ser ou não ser comutativa (porém necessitando de elemento neutro,
de simétrico e da associatividade).
Teorema 1.3.5. Dado um grupo (A, •), para quaisquer a, b, x ∈ A com a , b, então x•a , x•b
e a•x , b•x.
•C •V •A •Ṕ •T •Ṕ. 53 •Ú •S
Prova. Vamos supor que a , b e que exista um z ∈ A tal que z•a = z•b, então
z0 • (z•a) = z0 • (z•b)
⇒
e•a=e•b
⇒
a=b,
o que contraria a hipótese. A outra parte da proposição pode ser demonstrada da
mesma forma (por negação).
1.3.2.
Propriedades de grupos
Já comentamos num rodapé (26, pág. 45) que podemos ter uma operação definida sobre
um conjunto composto por um único elemento. Seja B = {b} e a operação f (b, b) 7→ b
(observe que essa é a única função que pode ser definida tendo {b}×{b} como domínio e
{b} como domínio). É claro que essa operação possui elemento neutro e que ele é igual
ao seu próprio simétrico (daí todos os elementos de B possuem simétrico), além disso, a
operação é associativa, uma vez que: f (b, f (b, b)) = f (b, b) = f ( f (b, b), b). Portanto estamos
diante de um grupo. Dado um grupo (A, •), o seu menor subgrupo é justamente ({e}, •),
onde e é o elemento neutro do grupo.
Teorema 1.3.6. Dado um grupo (A, •) qualquer, vale: (a0 )0 = a, ∀a ∈ A .
Prova. Da definição de elemento simétrico, temos:
(a0 )0 • a0 = a0 • (a0 )0 = e ,
•C •V •A •Ṕ •T •Ṕ. 54 •Ú •S
daí, como a operação é associativa:
[(a0 )0 • a0 ] • a = e • a
(a0 )0 • [a0 • a] = a
(a0 )0 • e = a
(a0 )0 = a .
Teorema 1.3.7. Qualquer que seja o grupo (A, •), vale:32
(a • b)0 = b0 • a0
∀a, b ∈ A .
Prova. Da definição de elemento simétrico (a • b)0 • (a • b) = e, daí, da associatividade,
32
Essa propriedade é particularmente importante para os grupos não-comutativos, uma vez que para o
caso dos grupos comutativos vale: (a • b)0 = a0 • b0 .
•C •V •A •Ṕ •T •Ṕ. 55 •Ú •S
tem-se:
(a • b)0 • (a • b) = e
[(a • b)0 • (a • b)] • b0 = e • b0
(a • b)0 • [(a • b) • b0 ] = b0
(a • b)0 • [a • (b • b0 )] = b0
(a • b)0 • [a • e] = b0
(a • b)0 • a = b0
[(a • b)0 • a] • a0 = b0 • a0
(a • b)0 • [a • a0 ] = b0 • a0
(a • b)0 • e = b0 • a0
(a • b)0 = b0 • a0 .
Teorema 1.3.8. Dado um grupo (A, •), então x • x = x ⇔ x = e .
Prova.
1) x = e ⇒ x•x = e•x = e ⇒ x•x = x;
2) x•x = x ⇒ (x•x)•x0 = x•x0 ⇒ x•(x•x0 ) = e ⇒ x•e = e,
daí x = e .
Quando o conjunto A de um grupo (A, •) possui número finito de elementos, diz-se
que (A, •) é um grupo finito e que o número de elementos de A é a ordem do grupo (A, •).
•C •V •A •Ṕ •T •Ṕ. 56 •Ú •S
Quando A não possui número finito de elementos, diz-se que (A, •) é um grupo infinito
ou um grupo de ordem infinita.
1.3.3.
Exemplos de grupos finitos
Apresentaremos alguns exemplos de grupos. Inicialmente ilustraremos os grupos
finitos.
1.3.3.1. Grupos de ordem 1
Conforme já comentamos (após a demonstração do Teorema 1.3.5, pág. 53): A = {e} e
f : {e}×{e} → {e} tal que (e, e) 7→ e é (a única possibilidade de) um grupo de ordem 1.
Um exemplo de grupo de ordem 1 pode ser visto no conjunto {1} ⊂ R munido
da operação de multiplicação em R; outro exemplo é o conjunto {0} ⊂ R munido da
operação de adição nos reais.
1.3.3.2. Grupos de ordem 2
Dado A = {e, a}, só é possível definir um único grupo de ordem dois, tendo e como
elemento neutro. Para verificar essa afirmação, consideraremos duas possibilidades de
operações candidatas para formar um grupo de ordem 2: • e (tendo e como elemento
neutro), definidas por:
e•e=e e•a=a
ee=e ea=a
a•e=a a•a=e
ae=a aa=a.
•C •V •A •Ṕ •T •Ṕ. 57 •Ú •S
As imagens dos pares que contêm o elemento neutro e devem ser sempre respeitadas,
as únicas variantes que poderiam ocorrer seriam a•a = e ou aa = a. A proposta leva a
absurdo; vejamos:
a,e ⇒ aa,ae ⇒ a,a.
Uma tabuada para um grupo de ordem dois deve estar enquadrada na tabela da
operação • apresentada anteriormente. Observa-se que o elemento a é igual ao próprio
simétrico, i.e., a = a0 . (Essa igualdade não deve ser confundida com a que trata o
Teorema 1.3.8.)
Um exemplo de grupo de ordem 2 pode ser vista no conjunto {1, −1} ⊂ R munido
da operação de multiplicação em R. A listagem das duas operações enseja que se
represente a função que define a operação num grupo finito por meio de uma tabela, a
tabuada da operação binária.
1.3.3.3. Grupos de ordem 3
Seja o conjunto A = {e, a2 , a3 } e a operação • representada pela tabuada da Tab. 1.1. Essa é
a única forma possível para que se tenha um grupo de ordem três. Podemos identificar
e como sendo o elemento neutro, além disso: a2 • a2 = a3 e a3 • a3 = a2 , e mais: a03 = a2
e a02 = a3 . (Observa-se que um grupo de ordem 3 apresentará sempre a propriedade
comutativa.)
As rotações num plano exemplificam vários grupos finitos. Para ângulos no plano,
podemos definir a seguinte relação de equivalência: dois ângulos α e β são côngruos se
existe k ∈ Z tal que α − β = 2kπ, sendo os ângulos expressos em radianos (ver rodapé
•C •V •A •Ṕ •T •Ṕ. 58 •Ú •S
Tabela 1.1: Tabuada para um grupo de ordem 3.
•
e
a2
a3
e
e
a2
a3
a2
a2
a3
e
a3
a3
e
a2
18, pág. 159) e operados algebricamente como números reais (prove que essa é uma
relação de equivalência). Assim, diz-se que dois ângulos num mesmo plano são ângulos
côngruos se eles pertencem a mesma classe de equivalência definida por essa relação.
Em particular, para o conjunto {Cl0 , Cl2π/3 , Cl4π/4 } munido da operação de composição
ângulos no plano, teremos um grupo de ordem três, o qual é isomorfo ao grupo de
simetria de um triângulo equilátero, i.e., das rotações que podem ser realizadas em um
triângulo equilátero sem que sua orientação espacial fique alterada. Observa-se que
e = Cl0 é o elemento neutro desse grupo e compare com a tabuada da Tab. 1.1.
1.3.3.4. Grupos de ordem 4
Seja o conjunto A = {e, a2 , a3 , a4 }. Com estrutura algébrica de grupo, é possível definir
quatro operações distintas sobre um conjunto com quatro elementos, considerando e
•C •V •A •Ṕ •T •Ṕ. 59 •Ú •S
como elemento neutro. As tabuadas da Tab. 1.2 ilustram essas quatro operações.33
Tabela 1.2: Tabuadas para grupos de ordem 4.
1
•
e
a2
a3
a4
3
•
e
a2
a3
a4
2
e
e
a2
a3
a4
a2
a2
e
a4
a3
a3
a3
a4
e
a2
a4
a4
a3
a2
e
•
e
a2
a3
a4
e
e
a2
a3
a4
a2
a2
a3
a4
e
a3
a3
a4
e
a2
a4
a4
e
a2
a3
•
e
a2
a3
a4
4
e
e
a2
a3
a4
a2
a2
e
a4
a3
a3
a3
a4
a2
e
a4
a4
a3
e
a2
e
e
a2
a3
a4
a2
a2
a4
e
a3
a3
a3
e
a4
a2
a4
a4
a3
a2
e
Observa-se que em todos esses quatro grupos as operações são comutativas, conforme pode ser facilmente verificado (note-se como os quadros das imagens são simé33
Note-se que a lei do corte em um grupo impõe que, na tabuada para esse grupo, um elemento ocorra
uma única vez numa linha ou numa coluna.
•C •V •A •Ṕ •T •Ṕ. 60 •Ú •S
tricos em relação à “diagonal principal”).
1
1
No grupo (A, •), todo elemento é igual ao próprio simétrico, além disso, (A, •) possui
três subgrupos de ordem 2, a saber:
1
1
1
({e, a2 }, •), ({e, a3 }, •) e ({e, a4 }, •),
1
além do subgrupo trivial de ordem 1: ({e}, •). Os outros três grupos possuem um único
subgrupo de ordem dois, a saber:
2
3
4
({e, a2 }, •), ({e, a3 }, •) e ({e, a4 }, •),
além dos subgrupos de ordem 1:
(justifique as igualdades)
1
2
3
4
({e}, •) = ({e}, •) = ({e}, •) = ({e}, •).
1.3.4.
Exemplos de grupos infinitos
Listaremos alguns exemplos de grupos infinitos, por meio de objetos muito comuns em
matemática elementar.
1.3.4.1. Grupo de adição nos inteiros
Considere Z (o conjunto dos números inteiros) e a operação de adição sobre Z. É fácil
verificar que (Z, +) é um grupo. Com efeito:
•C •V •A •Ṕ •T •Ṕ. 61 •Ú •S
1. a soma de dois inteiros é um inteiro, logo a adição nos inteiros é fechada;
2. o elemento (zero) 0 ∈ Z é o elemento neutro da adição, i.e., 0+a = a+0 = a, para todo
a ∈ Z;
3. todo inteiro possui simétrico aditivo, i.e., dado a ∈ Z, existe a0 = −a tal que a+(−a) =
(−a)+a = 0 e, finalmente, como é bem sabido,
4. a adição sobre os inteiros é associativa.
Além dessas propriedades que caracterizam a estrutura de grupo, a adição nos reais
também é comutativa.
É claro que são grupos (aditivos): (Q, +), (R, +) e (C, +), sendo Q o conjunto dos
números racionais, R o conjunto dos números reais e C o conjunto dos números complexos.
1.3.4.2. Grupo de multiplicação nos racionais
Como o racional zero (0 ∈ Q) não possui simétrico multiplicativo, o conjunto dos números racionais munido da operação de multiplicação não forma um grupo. Esse
pequeno problema pode ser contornado se considerarmos o conjunto Q? = Q−{0}. É
fácil verificar que (Q? , · ) é um grupo. Da mesma forma, são grupos: (R? , · ) e (C? , · ),
sendo R? = R−{0} e C? = C−{0}. Ocorre ainda que (Q? , · ) é subgrupo de (R? , · ), o qual,
por sua vez, é subgrupo de (C? , · ).
•C •V •A •Ṕ •T •Ṕ. 62 •Ú •S
Se considerássemos a redação do item G.4 (pág. 51) como: “Todo elemento de A,
possivelmente com a exceção de um único elemento, possui elemento simétrico”, teríamos outra opção para tratar com os chamados grupos multiplicativos;34 porém, como
essa opção não é muito habitual, é preferível considerar o conjunto A de forma que não
contenha esse “elemento patológico” e manter os postulados de definição de grupo.35
De qualquer forma, considerar um grupo como multiplicativo ou como um grupo
aditivo é uma questão de notação, costuma-se denotar por “+” a operação num grupo
considerado como aditivo e por “ · ” a um grupo considerado como multiplicativo.
Pergunta: qual o elemento neutro de (C? , · )?
1.3.4.3. Grupo de adição nas matrizes de mesma ordem
Considere o conjunto M das matrizes reais m×n e a operação de adição A+B em M,
tal que (ai j )+(bi j ) = (ai j +bij ), sendo A = (aij ) e B = (bij ) dois elementos genéricos de M. O
elemento neutro dessa operação é a matriz E = (aij ) = (0), i.e., os elementos de E são todos
nulos. Dado A = (ai j ), o elemento simétrico é A0 = (−aij ). Além disso, a adição de matrizes é
associativa. Dessa forma, esse é outro exemplo de grupo infinito, o qual também possui
propriedade comutativa. São subgrupos de (M, +) as restrições às matrizes racionais e
às matrizes inteiras (munidas da operação de adição de matrizes).
34 Isto é, os grupos que, para estarem bem definidos num conjunto, precisam que se descarte um dos
elementos desse conjunto (geralmente o elemento neutro do grupo aditivo associado a esse conjunto).
35 A preocupação que nos levou a essa observação foi a estrutura de corpo que estudaremos oportunamente.
•C •V •A •Ṕ •T •Ṕ. 63 •Ú •S
1.3.4.4. Grupo de transformações
em um conjunto
Seja M um conjunto não vazio e TM o conjunto de todas as bijeções de M em M. De
modo geral, a composição de funções [que possuem domínios iguais e contradomínios
iguais] define uma operação (fechada), que possui elemento neutro (a função identidade
em M) e é associativa (Teorema 1.2.1, pág. 37). Quando consideramos a composição de
funções em TM , i.e.,36
f : M ↔ M, g : M ↔ M 7−→ f ◦ g : M ↔ M ,
todo elemento de TM possui simétrico (a própria função inversa). Dessa forma, estamos
diante de um grupo (TM , ◦). A qualquer subgrupo de (TM , ◦) chamamos grupo de
transformações37 em M.
1.3.4.5. Notação exponencial
Dado um grupo qualquer (A, •), costuma-se usar a seguinte notação quando encarado
como um grupo multiplicativo:38
É usual denotar uma bijeção λ com domínio A e contradomínio B por λ : A ↔ B.
Esses grupos são muito utilizados em física teórica, por exemplo, é possível considerar um movimento
de um sistema mecânico (não-quântico) como gerado por um grupo (contínuo) de transformações (a partir
do estado inicial num instante t = t0 ).
38 Quando encarado como grupo aditivo, usa-se a notação: 0a = e, 1a = a e (n+1)a = na • a , para todo n ∈ N.
36
37
•C •V •A •Ṕ •T •Ṕ. 64 •Ú •S
para todo a ∈ A :
a0 = e
a1 = a
an+1 = an • a ∀n ∈ N .
(1.3)
Observe-se que essa notação é aplicada a qualquer grupo, independentemente do grupo
ser multiplicativo. Em face da associatividade, pode-se dispensar o uso dos parênteses
para indicar os pares que se toma para operar.
Teorema 1.3.9. Dado um grupo (A, •), então
am • an = am+n , para todo a ∈ A e ∀ m, n ∈ N∪{0} .
Prova. Apresentaremos duas provas para essa proposição: uma intuitiva, outra mais
formal (por indução matemática). Observamos que
am • an = (a • . . . • a) • (a • . . . • a)
| {z } | {z }
m “operações”
n “operações”
= (a • . . . • a) • (a • . . . • a)
|
{z
}
(m+n) “operações”
=a
m+n
.
Para demonstrarmos por indução, verificaremos primeiro se a proposição é válida para
n = 0:
am • a0 = am • e = am = am+0 ,
•C •V •A •Ṕ •T •Ṕ. 65 •Ú •S
e mais: a validade para n = 1 está garantida pela própria definição da notação. Agora
vamos supor que a proposição seja válida para n = α, assim, am •aα = am+α , dessa forma,
multiplicando à esquerda por a, temos:
am+α • a = (am • aα ) • a
= am • (aα • a)
= am • (aα+1 )
= am • aα+1 ,
finalmente, da definição am+α •a = am+α+1 .
Também é fácil provar:
Teorema 1.3.10. Dado um grupo (A, •), então
(am )n = am · n ∀a ∈ A e ∀ m, n ∈ N∪{0} .
Prova. A notação am indica a operação “•” iterada de a por m vezes, portanto (am )n
indica a “operação •” iterada de am por n vezes, o qual, por sua vez, é a “operação •”
iterada de a por m vezes, logo em (am )n temos a “operação •” iterada de a por mn vezes
(m vezes n vezes).
1.3.4.6. Notação exponencial com expoente inteiro
Tratando-se de um grupo, todo elemento possui simétrico. Dessa forma, também se
usa a−1 para denotar o simétrico de a ∈ A ou ainda, mais geralmente, a−n para indicar
•C •V •A •Ṕ •T •Ṕ. 66 •Ú •S
o simétrico do elemento an ∈ A (n ∈ N). Portanto, a definição apresentada em (1.3) e
os Teoremas 1.3.9 e 1.3.10 também podem ser estendidos para os expoente inteiros, i.e.,
n ∈ Z. Formalmente:
Teorema 1.3.11. Dado um grupo (A, •), então, para todo a ∈ A e ∀ m, n ∈ Z,
am+n = am • an
1.3.5.
e
(am )n = am n .
Grupos isomorfos
Esta seção retoma o conceito de isomorfismo definido no §1.2.8.
Teorema 1.3.12. Consideremos dois grupos (A, ?) e (B, •) e vamos supor que exista um
isomorfismo h : A → B entre eles. Se e1 é o elemento neutro de (A, ?) e e2 o de (B, •),
então
h(e1 ) = e2 .
Prova. Vamos supor que h(e1 ) , e2 , então, para todo a ∈ A, temos: h(a) • h(e1 ) , h(a) • e2 ,
daí h(a ? e1 ) , h(a), dessa forma h(a) , h(a) para todo a ∈ A, o que é um absurdo; portanto
a hipótese h(e1 ) , e2 é falsa, completando a demonstração da proposição.
A título de problema, demonstre a seguinte proposição:
Teorema 1.3.13. Se f : A → B é um isomorfismo entre os grupos (A, ?) e (B, •), então
n
f (an ) = f (a)
∀a ∈ A e ∀ n ∈ N .
•C •V •A •Ṕ •T •Ṕ. 67 •Ú •S
1.3.6.
Grupo comutativo
Alguns grupos também apresentam a propriedade comutativa, nesse caso dizemos
grupo abeliano ou grupo comutativo. Um grupo que não possui a propriedade comutativa
é chamado grupo não-abeliano ou grupo não-comutativo. Por exemplo, o conjunto das
matrizes quadradas é um grupo comutativo para a adição e um grupo não-comutativo
para a multiplicação dessas matrizes. Um outro exemplo é o conjunto das bijeções
no conjunto dos reais munido da operação de composição de funções; consideremos
f1 (x) = x+5 e f2 (x) = 2x+3, então f1 ◦ f2 = 2x+8 e f2 ◦ f1 = 2x+13, portanto a composição de
bijeções não é comutativa.
Uma conseqüência importante da comutatividade num grupo abeliano fica aparente quando voltamos ao Teorema 1.3.7 (pág. 55). Ora, como num grupo qualquer (A, •)
[para quaisquer a e b em A] vale a igualdade:39 (a•b)0 = b0 •a0 , se o grupo (A, •) for
abeliano, então (a•b) = (b•a) e, daí, (a•b)0 = (b•a)0 , portanto (a • b)0 = a0 • b0 = b0 • a0 , assim,
no caso comutativo, nenhuma preocupação precisa ser dispensada quanto à ordem
com que se opera nem quanto à ordem com que se considera os elementos para obter
o simétrico de uma operação.
39
A plica indica o simétrico.
•C •V •A •Ṕ •T •Ṕ. 68 •Ú •S
1.4.
Corpo
Neste parágrafo, consideraremos um conjunto não vazio A munido de duas operações
distintas, que, de modo genérico, denotaremos:
f : A×A → A ; f (a, b) = a ⊕ b
g : A×A → A ; g(a, b) = a b .
Dado o conjunto A munido das operações ⊕ e , diremos que a terna (A, ⊕, ) é um
corpo se, para quaisquer a, b, c ∈ A, (todas) as propriedades seguintes são satisfeitas.
1.4.1.
Axiomas de corpo
1. Quanto à operação ⊕ :
C.1 É associativa: (a ⊕ b) ⊕ c = a ⊕ (b ⊕ c) .
C.2 Possui elemento neutro (que será denotado por 0, para qualquer corpo):
∃0 ∈ A ; a ⊕ 0 = 0 ⊕ a = a .
C.3 Todo elemento de x ∈ A possui simétrico para ⊕, que se denota por y = x, tal que:
x ⊕ y = y ⊕ x = 0; i.e., x ⊕ (x) = (x) ⊕ x = 0 .
C.4 É comutativa40 : a ⊕ b = b ⊕ a .
40
As propriedades C.1, C.2, C.3 e C.4 indicam que (A, ⊕) é um grupo comutativo.
•C •V •A •Ṕ •T •Ṕ. 69 •Ú •S
2. Quanto à operação :
C.5 É associativa: (a b) c = a (b c) .
C.6 Possui elemento neutro (que será denotado por 1, para qualquer corpo):
∃1 ∈ A ; a 1 = 1 a = a .
C.7 Todo elemento de A, exceto41 o elemento neutro de ⊕, possui simétrico (chamado
inverso), i.e., ∀x ∈ A−{0} , ∃ y ; x y = y x = 1 , denota-se: y = x−1 .
C.8 É comutativa42 : a b = b a .
3. Quanto às operações ⊕ e :
C.9 A operação é distributiva em relação a operação ⊕, i.e.:
a (b ⊕ c) = (a b) ⊕ (a c) .
Pode-se reconhecer nos axioma de corpo dois grupos abelianos, a saber: (A, ⊕)
e (A − {0}, ). A novidade, em relação ao que vimos ao estudar grupo, é estarmos
considerando um conjunto munido de duas operações que admitem a propriedade distributiva43 . Para cada um dos grupos valem as proposições de grupo, em particular, vale
41
Ver Teorema 1.2.8, pág. 45.
As propriedades C.5, C.6, C.7 e C.8 indicam que (A−{0}, ) é um grupo comutativo.
43 Um conjunto munido de duas operações que satisfaçam as propriedades de grupo com a exceção de C.7
é chamado anel.
42
•C •V •A •Ṕ •T •Ṕ. 70 •Ú •S
a lei do corte, porém, para a operação “” é preciso sempre discriminar44 o elemento
neutro da operação “⊕”, o qual não admite simétrico para a operação “”.
Observe-se que a propriedade distributiva (C.9), ao mesmo tempo que expõe a
propriedade de “distribuir”, também coloca a propriedade que permite “evidenciar”,
i.e., “pôr em evidência”, fatores comuns a diversas parcelas.
Três exemplos clássicos de corpo são:
(Q, +, · ) ,
(R, +, · )
e
(C, +, · ) ,
onde “ + ” e “ · ” indicam as operações usuais de adição e multiplicação nos reais45 .
Note-se que (Z, +, · ) não forma um corpo, uma vez que seus elementos não possuem
inverso multiplicativo, a não ser o elemento 1 e o seu simétrico −1; tampouco (N, +, · ).
O menor corpo que se pode definir é dado pela terna ({0, 1}, ⊕, ), sendo as operações
definidas pelas tabuadas da Tab. 1.3.
Outro exemplo ilustrativo de corpo finito é o que contém apenas três elementos: o
elemento neutro de ⊕ (o elemento 0), o elemento neutro de (o elemento 1) e o seu
simétrico (o elemento 1), ou seja, a terna ({1, 0, 1}, ⊕, ) que respeita as tabuadas da
Tab. 1.4. (Verifique se realmente esses dois sistemas algébricos finitos são corpos.)
Problema 1.4.1. No corpo dos reais, o seguinte exemplo mostra a importância em
destacar a possibilidade de estar multiplicando pelo “simétrico multiplicativo do zero”
44 Os símbolos 0 e 1 estão denotando os elementos neutros de cada uma das operações do corpo (⊕ e
, respectivamente), isso não significa que o conjunto A contenha necessariamente os naturais, ou que os
elementos por eles representados pertençam aos reais, i.e., nesse contexto pode ocorrer que {1, 0, 1} 1 R.
Trata-se, no caso geral, apenas de uma notação. A discriminação do zero quanto ao simétrico para a operação
faz com que se utilize a denominação de adição para a operação ⊕ e multiplicação para a operação , mesmo
•C •V •A •Ṕ •T •Ṕ. 71 •Ú •S
Tabela 1.3: Tabuadas para o corpo ({0, 1}, ⊕, ).
⊕ 0 1
0 1
0 0 1
0 0 0
1 1 0
1 0 1
Tabela 1.4: Tabuada para o corpo ({1, 0, 1}, ⊕, ).
⊕
1
0
1
1
1
1
0
0
1
0
1
1
0
1
1
1
0
1
1
1
0
1
0
0
0
0
1
1
0
1
(i.e., dividindo por zero). Aponte o erro na pseudodemonstração da igualdade 1 = 2,
que transcrevemos de [10, §12]:
“suponhamos que a = b, então
que o conjunto A não esteja contido nos reais ou nos complexos.
45 Os elementos do corpo (Q, +, · ) são chamados números racionais, os do corpo (R, +, · ) números reais e os
do corpo (C, +, · ) números complexos. Os elementos do grupo (Z, +) são chamados números inteiros.
•C •V •A •Ṕ •T •Ṕ. 72 •Ú •S
a b = a2 ,
a b − b2 = a2 − b2 ,
b (a − b) = (a + b) (a − b) ,
b=a+b,
b
= 2b ,
1 = 2
subtraindo b2 , obtemos:
fatorando:
dividindo por a−b:
como estamos supondo que a = b, então
ou seja,
(fim do problema).”
A notação exponencial (§1.3.4.5) num grupo é sempre aplicada apropriadamente ao
grupo (A−{0}, ) associado ao corpo (A, ⊕, ). Por outro lado, da transitividade, vale
(a⊕b) c = (a c)⊕(b c), em particular, (1⊕1) c = c⊕c e (a⊕1) c = (a c)⊕(c) (quaisquer
que sejam a, b e c em A); isso indica que a “notação exponencial” para o grupo (A, ⊕) é
mais bem expressa pela seguinte notação:
0a = 0 , 1a = a e (n + 1)a = na ⊕ a ,
qualquer que seja a em A e qualquer que seja n ∈ N, sendo a adição indicada por “ + ”
a adição usual nos naturais (mesmo que ⊕ não a seja). Para o corpo dos reais, essa
notação é redundante.
No caso geral, os axiomas de corpo ensejam a definição de duas operações em A
(cujas denominações estamos tomando emprestadas do corpo dos reais):
1. A subtração definida pela função
s : A×A → A tal que s(a, b) = a ⊕ (b) ,
•C •V •A •Ṕ •T •Ṕ. 73 •Ú •S
a qual podemos denotar por s(a, b) = a b.
2. A divisão definida em A−{0} pela função
d : (A−{0})×(A−{0}) → A tal que d(a, b) = a b−1 ,
a qual podemos denotar por d(a, b) = a b, ou ainda por d(a, b) = ba .
Deve-se observar que essas duas operações não são comutativas. A capacidade de síntese
contida nos axiomas de corpo fundamenta-se na opção do uso do elemento simétrico
para cada uma das duas operações (comutativas), ao invés do uso de quatro operações,
uma vez que duas dessas operações (as inversas) não são comutativas e podem ser
recuperadas a partir das que constam nos axiomas de corpo46 .
Algumas propriedades importantes serão apresentadas.
Teorema 1.4.1. Qualquer que seja o corpo (A, ⊕, ) e quaisquer que sejam a e b em A:
(a ⊕ b) = (a) ⊕ (b) .
Prova. Do47 Teorema 1.3.7: (a⊕b) = (b)⊕(a) e, da comutatividade de “ ⊕ ”, segue-se
a proposição.
46 Uma questão de nomenclatura: o resultado da adição é a soma, o da multiplicação é o produto, o da
subtração é a diferença e o da divisão é o quociente. Não se deve confundir a operação (que é uma função) com
um resultado dessa operação (que é um elemento do contradomínio dessa função).
47 Página 55, com x denotando o simétrico (aditivo) de x.
•C •V •A •Ṕ •T •Ṕ. 74 •Ú •S
Teorema 1.4.2. Qualquer que seja o corpo (A, ⊕, ) e qualquer que seja x ∈ A:
x0=0.
Prova. Como para qualquer y ∈ A vale yy = 0, então da distributividade, para qualquer
x ∈ A:
x (y y) = x 0
(x y) ⊕ [x (y)] =
(x y) ⊕ [(x y)] =
0=
Como uma prova alternativa temos: para todo x em A,
(x 0) ⊕ x = (x 0) ⊕ (x 1) = x (0 ⊕ 1) = x 1 = x ⇒ (x 0) ⊕ x = x .
Portanto, pela lei do corte (pág. 53) para o grupo (A, ⊕), fica provada a proposição.
Teorema 1.4.3. Num corpo qualquer (A, ⊕, ), quaisquer que sejam x e y em A, valem
as seguintes igualdades: (conhecidas como regras dos sinais da álgebra elementar)
(x) y = x (y) = (x y)
(x) (y) = x y .
Prova.
•C •V •A •Ṕ •T •Ṕ. 75 •Ú •S
1. Da primeira “regra”: usando a distributividade para (x) y ⊕ (x y) em A,
podemos escrever:
(x) y ⊕ (x y) = [(x) ⊕ x] y = 0 y = 0 ,
portanto (x) y = (x y). O restante da demonstração da regra fica como
exercício.
2. Da segunda “regra”: como x (y) = (x y), então
(x) (y) = [(x) y] = [(x y)] = x y .
A seguinte proposição, com base em uma estrutura de corpo sobre A, ensina a
“adição de frações”:
Teoreman 1.4.4.
Qualquer que seja o corpo (A, ⊕, ), quaisquer que sejam a, c ∈ A e
o
b, d ∈ A− 0 :
(a d) ⊕ (c b)
a c
⊕ =
.
b d
bd
n o
Prova. Como, por hipótese, b, d ∈ A− 0 , então:
•C •V •A •Ṕ •T •Ṕ. 76 •Ú •S
a c
⊕ =λ,
b d
(a b−1 ) ⊕ (c d−1 ) = λ ,
h
i h
i
(a b−1 ) b ⊕ (c d−1 ) b = λ b ,
h
i h
i
a (b−1 b) ⊕ (d−1 c) b = λ b ,
h
i
[a 1] ⊕ d−1 (c b) = λ b ,
h
i
a ⊕ d−1 (c b) = λ b ,
h
i
(a d) ⊕ d−1 (c b) d = (λ b) d ,
h
i
(a d) ⊕ (d−1 d) (c b) = λ (b d) ,
(a d) ⊕ [1 (c b)] = λ (b d) ,
(a d) ⊕ (c b) = λ (b d) ,
(a d) ⊕ (c b)
=λ.
(b d)
λ ∈ A,
por C.7,
por C.5 e C.8,
por C.7 e C.5,
por C.6,
por C.7,
por C.8 e C.5,
por C.7,
por C.6,
por C.7,
A importância da proposição anterior é inquestionável, bem como a que se segue.
n o
Teorema 1.4.5. Para o corpo (A, ⊕, ), para todo a, b ∈ A e c ∈ A− 0 :
ac a
= .
bc b
•C •V •A •Ṕ •T •Ṕ. 77 •Ú •S
Prova. Como c , 0, então, para λ ∈ A,
(Justifique cada passagem da demonstração)
ac
=λ
bc
a c = λ (b c)
a c = (λ b) c
(a c) c−1 = [(λ b) c] c−1
a (c c−1 ) = (λ b) (c c−1 )
a 1 = (λ b) 1
a=λb
a b−1 = (λ b) b−1
a b−1 = λ 1
a b−1 = λ .
n o
Teorema 1.4.6. Se (A, ⊕, ) for um corpo qualquer e a, b ∈ A− 0 , então
1 1 a⊕b
⊕ =
a b ab
e
1 1
1
=
.
a b ab
A demonstração dessa proposição fica como problema proposto.
•C •V •A •Ṕ •T •Ṕ. 78 •Ú •S
n o
Teorema 1.4.7. Se (A, ⊕, ) é um corpo qualquer, b, d, k ∈ A− 0 e se a, c ∈ A, então
a
c
=
b d
a + kc
a
c
= = .
b + kd b d
⇔
Prova.
a c
a = λb
= =λ ⇔
ck = λdk
b d
a + kc = λ(b + kd) ⇔
1.4.2.
⇔
a + kc
= λ.
b + kd
Solução de uma equação do primeiro grau num corpo qualquer
Seja um corpo (A, ⊕, ). Dados a, b ∈ A, podemos considerar a função
f : A → A; f (x) = (a x) ⊕ b .
Particularmente importante é o conjunto S = x ; f (x) = 0 , associado a função f . Apresentaremos uma solução detalhada para determinar os elementos48 de S.
Dada uma função qualquer, y = g(x), definida sobre um corpo, chama-se de raiz de g(x) a qualquer
elemento do conjunto S = {x ; g(x) = 0}.
48
•C •V •A •Ṕ •T •Ṕ. 79 •Ú •S
De (a x) ⊕ b = 0, podemos adicionar membro a membro o simétrico aditivo de b;
obtém-se:
[(a x) ⊕ b] ⊕ (b) = 0 ⊕ (b) ,
daí
(a x) ⊕ [b ⊕ (b)] = (b) ,
por conseguinte, (a x) ⊕ 0 = (b) ⇒ a x = (b). Agora:
1. se a , 0, multiplicando membro a membro pelo inverso de a:
a−1 (a x) = a−1 (b) ⇒ (a−1 a) x = a−1 (b) ⇒
1 x = a−1 (b) ⇒ x = a−1 (b),
nesse caso, S = {a−1 (b)} .
2. se a = 0 e:
(a) se b , 0, então, pelo Teorema 1.4.2, não existe nenhum x ∈ A, tal que ax = (b),
nesse caso, S = ∅;
(b) se b = 0, então x está indeterminado e, nesse caso, S = A.
Em resumo:
o
n
x; x = a−1 (b) ,
{x ; a x ⊕ b = 0} =
∅,
A ,
se a , 0
se a = 0 e b , 0
se a = 0 e b = 0 .
•C •V •A •Ṕ •T •Ṕ. 80 •Ú •S
Sobre a notação O uso da notação discriminada que estamos fazendo para as operações, não significa qualquer pedantismo. Nossa intenção é salientar o aspecto geral
de um corpo, sem particularizar esse ou aquele corpo (dos racionais, dos reais, dos
complexos...). Voltaremos para a notação mais usual, mas tenha sempre em mente
que estaremos fazendo uso das propriedades listadas nos axiomas de corpo, ou seja: a
indicação de uma subtração significa a adição do simétrico (aditivo) e a indicação de uma
divisão significa a multiplicação do inverso (multiplicativo), sendo sempre necessário
discriminar a possibilidade de uma “divisão” por zero.
1.4.3.
Solução da equação do segundo grau num corpo
Seja um corpo qualquer (A, +, · ). Dados a, b, c ∈ A, com a , 0, podemos considerar a
função f : A → A tal que f (x) = a·x2 +b·x+c. Estaremos ocupados com a determinação
dos elementos do conjunto S = {x ; a·x2 + b·x + c = 0}, o conjunto das soluções da equação
do segundo grau:
a · x2 + b · x + c = 0 .
Se a = 0, então recaímos no caso da equação do primeiro grau, já estudada.
Antes de demonstrarmos a expressão geral para as soluções de uma equação do
segundo grau,
√ vamos definir o que se entende por raiz quadrada. Dado x em A, denotamos por x (lê-se: raiz quadrada de x) para indicar um possível elemento de A tal
que:49
49
Pode ocorrer de
√
que 2 < Q.
√
√
√
2 < A. Por exemplo:
2<Q e
−1 < R. A título de curiosidade, provamos na pág. 335
•C •V •A •Ṕ •T •Ṕ. 81 •Ú •S
y=
√
x
y· y = x .
⇔
Dessa forma, dado√α ∈ A e a equação
x2 = α, temos: x·x = (−x)·(−x) = α. Portanto temos
√
duas soluções: x = α ou −x = α. Numa notação unificada, indicamos:
x=
√
α ou −x =
√
α
⇔
√
x=± α.
Observa-se que x2 = α é uma equação do segundo grau, sendo a = 1, b = 0 e c = −α.
Alguns produtos que são convenientes ter sempre em mente (os chamados produtos
notáveis) são: (note que estamos denotando 2 ≡ 1+1 e a·x ≡ a x)
(x + a) · (x + b) = x2 + (a + b) · x + a b
(x + a) · (x − a) = x2 − a2
(x + a)2 = x2 + 2 a x + a2 .
A título de exercício, demonstre cada uma dessas igualdades.
•C •V •A •Ṕ •T •Ṕ. 82 •Ú •S
1.4.4.
Prova da solução da equação do segundo grau em um corpo
Fazendo uso dos axiomas de corpo, vamos resolver a equação de segundo grau, no que
estaremos supondo que a , 0 e usando a notação a/b ≡ ba e 4 ≡ 2·2 = 22 :
0 = a x2 + b x + c
(como a , 0)
b
c
= x2 + · x +
(completando o quadrado)
a
a
c
b2
b2
b
= x2 + · x + + 2 − 2
a
a 4!a
4a
2
b
c
b2
b
= x2 + · x + 2 + − 2
a
a 4a
4a
!2
b
b2
c
= x+
+ − 2 ,
2a
a 4a
dessa forma50
50 Para completar o quadrado do binômio, adicionamos uma parcela nula constituía pela soma de um
elemento com o seu simétrico aditivo. A determinação desse elemento pode ser feita por inspeção ou por
meio de uma equação auxiliar, i.e., queremos determinar y tal que
(x + y)2 = x2 + 2x y + y2
portanto y =
b
2a
e
2y =
b
,
a
2
b
e a parcela que deve ser somada e subtraída é: y2 = 4a
2.
•C •V •A •Ṕ •T •Ṕ. 83 •Ú •S
!2
c
b2
=− + 2
a 4a
r
b
b2
c
x+
=±
−
2
2a
a
4a
r
b
b2
c
x=−
±
− ,
2a
4 a2 a
b
x+
2a
finalmente:
x=−
b
1 √ 2
±
· b − 4ac ,
2a 2a
conhecida como fórmula de Bhaskara51 . Como exercício, identifique as propriedades
que foram utilizadas no desenvolvimento anterior52 .
51 Bhaskara II 1114–1185, matemático indiano; escreveu o primeiro trabalho de uso sistemático do sistema
numérico decimal; foi o primeiro a usar a convenção ± (mais ou menos); resolveu as equações de 1o¯ e 2o¯
grau.
52 Não pretendemos fazer estudo sistemático das raízes de polinômios sobre um corpo, mas, do produto
notável
(x − α) x − β = x2 − α + β x + αβ ,
podemos identificar algumas propriedades envolvendo os coeficientes de uma função do segundo grau
y = ax2 +bx+c com as suas raízes.
•C •V •A •Ṕ •T •Ṕ. 84 •Ú •S
1.4.5.
Corpo ordenado
Um corpo ordenado é um corpo (A, +, · ) no qual se pôde destacar (e destacou-se) um
subconjunto P ⊂ A, chamado conjunto dos elementos positivos de A, tal que:
P.1 A soma e o produto de elementos positivos são positivos, i.e.,
a, b ∈ P ⇒ (a + b) ∈ P e (a · b) ∈ P .
P.2 Dado x ∈ A, exatamente uma das três alternativas pode ocorrer:53
ou x = 0, ou x ∈ P ou − x ∈ P .
Dessa forma, denotando P− = {−x ; x ∈ P}, temos que A = {0}∪P∪P− . Os elementos de P−
são chamados elementos negativos de A, enquanto os elementos de P∪{0} são chamados
não-negativos.
Teorema 1.4.8. Num corpo ordenado (A, +, · ), se a , 0, então a2 ∈ P.
Ora, dado x2 −(α+β)x+αβ, usando a propriedade distributiva, podemos pôr em evidência o fator (x−α);
obtemos assim:
y = x2 − (α + β) x + α β = (x − α) (x − β) ,
daí, para f (x) = ax2 +bx+c podemos dizer que, para a , 0, c/a é igual ao produto das raízes e que −b/a é igual
à soma das raízes. (O estudo das funções do segundo grau está no §2.12, pág. 200.)
53 Note-se que P.2 define uma relação de equivalência em A, uma vez que define uma partição em A.
•C •V •A •Ṕ •T •Ṕ. 85 •Ú •S
Prova. Se a ∈ P, então, pela propriedade [P.1], (a·a) ∈ P. Se a < P, então, −a ∈ P, daí
[(−a)·(−a)] ∈ P, portanto, como (−a)·(−a) = a·a, tem-se finalmente: (−a)2 ∈ P.
Observe-se que, como 1·1 = 1, uma conseqüência da proposição anterior é: para um
corpo ordenado ocorre sempre 1 ∈ P. Dessa forma, num corpo ordenado, −1 ∈ P− , ou
seja, num corpo ordenado não existe nenhum elemento cujo quadrado seja −1. Isso
significa que não é possível ter no corpo dos complexos um corpo ordenado54 .
Num corpo ordenado é possível definir uma relação de ordem (total). Formalmente:
num corpo ordenado (A, +, · ), dizemos que x < y (lê-se x menor do que y) se (e somente se)
(y−x) ∈ P, ou que x > y (lê-se x maior do que y) se55 (e somente se) (x−y) ∈ P. Uma expressão
que denota uma relação de ordem também é chamada desigualdade.
Dessa forma, x > 0 é equivalente a x ∈ P, enquanto x < 0 é equivalente a −x ∈ P.
As principais propriedades envolvendo uma relação de ordem num corpo podem ser
sintetizadas na seguinte proposição:
Teorema 1.4.9. Dado um corpo ordenado (A, +, · ), para essa relação de ordem, são
válidas as seguintes propriedades:
O.1 Transitividade:
se x < y e y < z, então x < z.
O.2 Tricotomia56 :
dados x, y ∈ A ocorre exatamente uma das alternativas seguintes:
ou x < y, ou y < x ou x = y.
54
55
56
Essa é uma conseqüência importante, muito pouco justificada na literatura.
Observe que definimos uma relação em A, a qual é chamada relação de ordem.
Essa propriedade ainda não havia sido definida.
•C •V •A •Ṕ •T •Ṕ. 86 •Ú •S
O.3 Monotonia da adição:
se x < y , então, para qualquer z ∈ A , x+z < y+z .
O.4 Monotonia da multiplicação:
x·z < y·z,
∀z > 0
se x < y ⇒
x·z > y·z,
∀z < 0
x·z = y·z = 0, para z = 0 .
O.5 Se x < y e se a < b, então57 x+a < y+b.
O.6 Se 0 < x < y e se 0 < a < b, então58 x·a < y·b.
Prova. Provaremos cada item da proposição.
1. Se x < y e se y < z, então y−x ∈ P e z− y ∈ P, dessa forma, por [P.1], tem-se
(y−x)+(z− y) ∈ P, daí z−x ∈ P, o que demonstra [O.1].
2. A propriedade [O.2] é apenas uma releitura de [P.2].
3. Se x < y, então y−x ∈ P, dessa forma, y+(z−z)−x = y−x ∈ P, o que significa que
(y+z) − (x+z) ∈ P, i.e., (x+z) < (y+z), o que prova [O.3].
57
58
Isso significa que se pode somar duas desigualdades membro a membro.
Isso significa que se pode multiplicar membro a membro duas desigualdades com elementos positivos.
•C •V •A •Ṕ •T •Ṕ. 87 •Ú •S
4. Se x < y e z > 0, então y−x ∈ P e z ∈ P, logo, por [P.1], (y−x)·z ∈ P, ou seja, x·z < y·z
(as outras duas partes da demonstração desse item da proposição ficam como problema proposto).
5. Se x < y e se a < b, então y−x ∈ P e b−a ∈ P, logo, por [P.1], (y− x) + (b−a) ∈ P, e
como (y− x) + (b−a) = (y+ b) − (x+a), pode-se escrever: (x+a) < (y+ b).
6. Se 0 < x < y e se 0 < a < b, então x, y, a, b ∈ P, portanto, por [O.4], 0 < x·a < y·a e
0 < y·a < y·b, assim, da transitividade, x·a < y·b.
O que completa a demonstração do teorema.
Num corpo ordenado (A, +, · ), define-se também a relação indicada por “≤” (lê-se
menor ou igual) da seguinte forma:
x≤y
⇔
x < y ou x = y ,
isto é, se y−x = 0 ou se (y−x) ∈ P. Define-se ainda a relação simbolizada por “ ≥ ” (lê-se
maior ou igual) tal que: x− y = 0 ou se (x− y) ∈ P, indica-se x ≥ y.
Não pretendemos esgotar o assunto, nossa intenção é fornecer alguma ‘sustância’
para o trabalho algébrico com desigualdades.
1.4.6.
Valor absoluto num corpo ordenado
Seja um corpo ordenado (A, +, · ) e P o conjunto dos positivos; a tricotomia [O.2 do
Teorema 1.4.9] da relação de ordem enseja definirmos a função módulo ou função valor
•C •V •A •Ṕ •T •Ṕ. 88 •Ú •S
absoluto (em A) como sendo f : A → P∪{0} tal que x 7→ |x|, onde:
x,
|x| =
0,
−x,
se x > 0 ;
se x = 0 ;
se x < 0 .
Deve-se observar que, da definição, |x| = 0 ⇔ x = 0. Dado x em A, dizemos que |x| é o
módulo de x.
Muito importante para assuntos como seqüências, séries, limites, convergência,
(dentre outros) é o conhecimento de algumas proposições envolvendo desigualdades
e módulo num corpo ordenado. Demonstre estas proposições como problema proposto
(ver [18, pág. 57 e pág. 58])
Proposição 1.4.1. Num corpo ordenado (A, +, · ), dados x e a em A, as seguintes afirmações são equivalentes: (note-se que: a ≥ 0 ⇔ 0 ≤ a)
1. −a ≤ x ≤ a;
2. x ≤ a e −x ≤ a;
3. |x| ≤ a.
Proposição 1.4.2. Num corpo ordenado (A, +, · ), ∀a, b, x ∈ A, tem-se:
|x − a| ≤ b
⇔
a−b≤x≤a+b.
•C •V •A •Ṕ •T •Ṕ. 89 •Ú •S
Proposição 1.4.3. Num corpo ordenado (A, +, · ), ∀x, y, z ∈ A, tem-se:
1. |x + y| ≤ |x| + |y| conhecida como desigualdade do triângulo;
2. |x · y| = |x| · |y| ;
3. |x| − |y| ≤ | |x| − |y| | ≤ |x − y| ;
4. |x − z| ≤ |x − y| + |y − z| .
1.4.6.1. Nota
No §1.6, pág. 119, definimos a norma de um complexo; mesmo não se tratando de um
corpo ordenado, o corpo dos complexos admite a definição da função norma, que está
intimamente relacionada com a função módulo no corpo ordenado dos reais, uma vez
que essas duas funções são iguais em R ⊂ C.
1.4.7.
Sistema de equações lineares
Neste parágrafo, discutiremos brevemente como podemos resolver um sistema de equações lineares de duas equações (e duas incógnitas) num corpo qualquer. Estaremos longe
de esgotar o assunto, mas mostraremos um caminho para um método geral de resolver
esse problema, método que é estudado exaustivamente em cursos de Álgebra Linear.
•C •V •A •Ṕ •T •Ṕ. 90 •Ú •S
Considere o sistema de equações lineares (nas incógnitas x e y):
(
a11 · x + a12 · y = b1
a21 · x + a22 · y = b2 .
(1.4)
Antes de qualquer outra consideração, veremos o significado dessas expressões. Cada
um das equações do sistema defini um conjunto59 :
n
o
Si = (x, y) ; ai1 x + ai2 y = bi e i ∈ I2 ,
onde cada par (x, y) ∈ Si satisfaz identicamente a relação ai1 x+ai2 y = bi . O sistema (1.4)
trata dos pares (x, y) que satisfazem identicamente as duas equações simultaneamente,
i.e., o conjunto de soluções de (1.4) é o conjunto S = S1 ∩S2 .
Se nenhuma consideração é feita com respeito ao conjunto sobre o qual os elementos
que constam em (1.4) estão definidos, então, tacitamente, estar-se-á considerando o corpo
dos complexos ou o corpo dos reais, dependendo do contexto (da situação física) que se
está a considerar. Observe que não se trata de considerar apenas um dado conjunto,
há que se considerar uma estrutura algébrica, caso contrário, não haveria como operar
algebricamente. No que se segue, estaremos considerando que o sistema (1.4) está
definido num corpo qualquer (A, +, · ).
59
Estaremos usando indistintamente a seguinte notação: a · b ≡ a b .
•C •V •A •Ṕ •T •Ṕ. 91 •Ú •S
1.4.7.1. Resolução utilizando as características de corpo
A partir dos axiomas de corpo e das proposições já demonstradas, se60 a11 , 0, tiramos
da primeira equação:
b1 − a12 y
,
(1.5)
a11 , 0 ⇒ x =
a11
assim
S=
(
b
1 −a12
a11
y
,y ;
b1 − a12 y
a21 ·
+ a22 · y = b2
a11
)
e ficamos com uma equação do primeiro grau em y:
a21 ·
b1 − a12 y
+ a22 y = b2
a11
cuja solução é: (verifique)
(a11 a22 − a12 a21 ) · y = a11 b2 − a21 b1 .
(1.6)
Dessa forma, temos duas situações a estudar em separado:
60 Essa consideração não traz qualquer perda de generalidade nos argumentos a seguir, uma vez que
podemos renumerar as equações e até mesmo renomear as variáveis de modo que o correspondente a essa
hipótese seja respeitado.
•C •V •A •Ṕ •T •Ṕ. 92 •Ú •S
. Se (a11 a22 − a12 a21 ) , 0:
nesse caso existe o inverso multiplicativo de (a11 a22 − a12 a21 ), do que podemos
escrever:
y=
a11 b2 − a21 b1
a11 a22 − a12 a21
e daí, substituindo y na segunda equação do sistema:
(
)
1
a11 b2 − a21 b1
b1 −
a11
a11 a22 − a12 a21
(
)
1 a11 a21 b1 − a12 a21 b1 + a12 a21 b1 − a11 a12 b2
=
a11
a11 a22 − a12 a21
(
)
1 a11 a21 b1 − a11 a12 b2
=
a11
a11 a22 − a12 a21
a11 a21 b1 − a11 a12 b2
=
.
a11 a22 − a12 a21
x=
. Se (a11 a22 − a12 a21 ) = 0:
quando (a11 a22 −a12 a21 ) = 0, então a11 a22 = a12 a21 , daí
a22 =
a12 a21
,
a11
•C •V •A •Ṕ •T •Ṕ. 93 •Ú •S
portanto
a22
a21
a = a
12
11
a = 0
22
se a12 , 0 ;
se a12 = 0 .
– No segundo caso, se a12 = 0 = a22 , o sistema reduz-se a:
a11 x = b1
a21 x = b2 ,
e as duas equações do sistema fornecem a mesma relação. Nesse caso o
sistema está indeterminado e, de tal forma que,
n
o
S = ab111 , y ; y ∈ A .
– No primeiro caso, se a12 , 0, existe λ ∈ A tal que a22 = λa12 e a21 = λa11 , isto é,
nesse caso o sistema reduz-se a:
(
a11 · x + a12 · y = b1
λ a11 · x + λ a12 · y = b2
que será:
se b2 , λb1
impossível
indeterminado se b2 = λb1 ,
•C •V •A •Ṕ •T •Ṕ. 94 •Ú •S
sendo impossível, ocorre: S = ∅; sendo indeterminado: as duas equações do
sistema fornecem a mesma relação entre x e y, de tal forma que
n o
S = x, y ; a11 x + a12 y = b1 ,
nesse caso dizemos que as equações não são linearmente independentes.
Quando b1 = b2 = 0, dizemos que (1.4) é um sistema linear homogêneo. Do que vimos,
um sistema homogêneo terá solução única, x = 0 e y = 0, a chamada solução trivial, se
(a11 a22 −a12 a21 ) , 0; ou será indeterminado, i.e., o conjunto de soluções será
n o
S = x, y ; a11 x + a12 y = 0 .
Fazendo uso das propriedades de corpo, é possível obter a solução do sistema linear
de outra forma. O procedimento é simples, basta multiplicar cada uma das equações por
um dos coeficientes das incógnitas de tal forma que se elimine uma dessas incógnitas
subtraindo-se membro a membro as equações do sistema. (Encare esse procedimento como
um problema proposto.)
1.4.7.2. Resolução utilizando a álgebra matricial
Este parágrafo cumprirá o objetivo de mostrar (ou recordar) um método sistemático
para a resolução de um sistema equações lineares. Não é nossa intenção discorrer sobre
as operações matriciais (adição e multiplicação) nem, tampouco, sobre suas propriedades mais específicas, iremos aplicá-las. Dado um sistema (1.4), podemos considerar
•C •V •A •Ṕ •T •Ṕ. 95 •Ú •S
três matrizes, a saber:
M=
a11
a21
!
a12
,
a22
X=
x
y
!
B=
e
!
b1
.
b2
É fácil verificar que:
MX = B
⇔
!
!
a11 x + a12 y
b
= 1 ,
a21 x + a22 y
b2
ou seja,
!
!
a11 x + a12 y − b1
0
=
,
a21 x + a22 y − b2
0
que, da relação de igualdade entre matrizes, recupera o sistema (1.4). Para aqueles que
ainda não estão habituados com a notação matricial ou com o seu emprego, é bom ter
sempre em mente a relação
(
a11 x + a12 y = b1
a21 x + a22 y = b2
⇔
a11
a21
a12
a22
!
!
!
x
b1
=
.
y
b2
A grande vantagem inicial dessa notação matricial é que uma matriz quadrada, como M,
pode admitir inversa multiplicativa (poder admitir não significa que admita). A título
de ilustração, vamos determinar a matriz
inversa de M. Bem, denotando por 1l a matriz
−1
identidade (no caso, 2×2) e por M = sij , a simétrica multiplicativa de M, temos que
•C •V •A •Ṕ •T •Ṕ. 96 •Ú •S
MM−1 = 1l, então devemos determinar 4 elementos sij tais que
!
!
!
a11 a12 s11 s12
1 0
=
,
a21 a22 s21 s22
0 1
daí
a11 s11 + a12 s21
a21 s11 + a22 s21
!
a11 s12 + a12 s22
1
=
a21 s12 + a22 s22
0
!
0
,
1
de onde tiramos o seguinte sistema linear em sij :
a11 s11 + a12 s21 = 1
a21 s11 + a22 s21 = 0
a11 s12 + a12 s22 = 0
a21 s12 + a22 s22 = 1 ,
assim, a segunda equação pode ser usada para determinar uma relação entre s11 e s21 ,
a qual (se α = a11 a22 −a12 a21 , 0), levada à primeira, permite determinar:
s21 = −
a21
a11 a22 − a12 a21
e
s11 =
a22
;
a11 a22 − a12 a21
a terceira equação pode ser usada para determinar uma relação entre s22 e s12 , a qual,
levada à quarta, permite determinar: (se α = a11 a22 −a12 a21 , 0)
s12 = −
a12
a11 a22 − a12 a21
e
s22 =
a11
,
a11 a22 − a12 a21
•C •V •A •Ṕ •T •Ṕ. 97 •Ú •S
ou seja, definindo o determinante da matriz (quadrada) M como sendo (o elemento do
corpo sobre o qual a matriz está definida):
a
det 11
a21
!
a12
= a11 a22 − a12 a21 ,
a22
então (verifique que MM−1 = M−1 M = 1l)
M−1 =
1
a22
det(M) −a21
!
−a12
.
a11
Uma matriz quadrada cujo determinante é igual a zero é chamada matriz singular, (pelo
que foi visto para uma matriz 2×2) uma matriz (quadrada) possui inversa (multiplicativa) se, e somente se, for não-singular. Tendo em mãos a matriz inversa, podemos obter
sistematicamente a solução do sistema linear. Com efeito:
MX = B
M−1 (MX) = M−1 B
M−1 M X = M−1 B
1lX = M−1 B
X = M−1 B
•C •V •A •Ṕ •T •Ṕ. 98 •Ú •S
ou, diretamente:
!
x
a
= 11
y
a21
a12
a22
!−1
b1
b2
!
!
1
a22 b1 − a12 b2
.
=
a11 a22 − a12 a21 −a21 b1 + a11 b2
Isto é, se det(M) , 0,
a22 b1 − a12 b2
x=
a
11 a22 − a12 a21
−a21 b1 + a11 b2
y =
a11 a22 − a12 a21
O método matricial aplicado aos sistemas lineares presta-se perfeitamente para a resolução computacional algébrica.
1.5.
Deslocamentos e grandezas vetoriais
Apresentamos neste parágrafo um ensaio que ilustra um procedimento para definir
uma grandeza com base em fatos físicos observáveis e uma forma para sintetizar as
propriedades levantadas num contexto axiomático. O fato físico aqui exemplificado é
a estrutura algébrica dos deslocamentos (para a cinemática da partícula) e o contexto
axiomático é dos espaços vetoriais.
•C •V •A •Ṕ •T •Ṕ. 99 •Ú •S
É comum encontrarmos nos textos elementares sobre vetores a seguinte tentativa
de definição: “vetores são grandezas que possuem módulo direção e sentido”. Alguns se satisfazem
com esta “definição”, outros a consideram insuficiente, até mesmo errada, parcial, no
mínimo.
É conveniente que se diga com destaque: existem grandezas para as quais podemos
associar módulo direção e sentido e que não podem ser consideradas como grandezas
vetoriais. Um exemplo clássico para tais grandezas é a composição de rotações (finitas)
de um corpo rígido (em torno de eixos não paralelos). Enquanto a composição de
vetores é comutativa, a composição de rotações [finitas, consideradas no R3 e em torno
de eixos não paralelos] não é comutativa. Você pode verificar isso, por exemplo, girando
um livro em torno de dois eixos [fixos no livro] não paralelos: gire de 90◦ em torno de um
eixo; em seguida gire de 90◦ em torno de outro eixo perpendicular ao primeiro (o qual
girou juntamente com o livro). Repita a operação comutando (trocando, permutando)
a ordem em que foram tomados os eixos de rotação. Compare a posição final do
livro para cada uma das composições (partindo da mesma posição, utilize dois livros
para facilitar a comparação). Esse exemplo ilustra bem que a estrutura algébrica é
fundamental para a caracterização de uma grandeza vetorial, pois, podemos associar:
um módulo (o do ângulo de rotação), uma direção (a do eixo em torno do qual se efetua
a rotação) e um sentido (orientando o eixo, podemos considerar como um ângulo
positivo de rotação aquele que pondo o polegar da mão direita no sentido positivo do
eixo faz com que gire no sentido do fechar a mão direita), e, mesmo assim, a álgebra
da composição de tais rotações não é comutativa. Uma grandeza vetorial é uma grandeza
algébrica. Um outro aspecto negativo para a “pretensa definição” anterior é que ela
•C •V •A •Ṕ •T •Ṕ. 100 •Ú •S
pode induzir no estudante (que se inicia) uma idéia que só é possível se considerar
vetores em dimensão três, como se cada uma das dimensões respondesse (de alguma
forma) pelo módulo, pela direção ou pelo sentido. Isso não é correto! É possível, e,
em muitos casos, altamente conveniente, adotar-se em física (mesmo em física clássica)
vetores em “espaços de dimensão superior a três”.
Para tratar com deslocamentos, poderíamos associar diretamente segmentos orientados e uma regra de composiçãopouco61 . Nossa intenção, no entanto, é mostrar
a caracterização de uma grandeza vetorial, tendo por pano de fundo os axiomas que
definem um espaço vetorial V num corpo K [12], dessa forma, procederemos a um
desenvolvimento mais “primitivo”, como se não conhecêssemos previamente os segmentos orientados.
Para fixar uma linha de raciocínio, consideremos um observador que anota, de
alguma forma, as posições P1 , P2 . . . Pn ocupadas por uma partícula nos instantes
t1 , t2 . . . tn , respectivamente (esse observador pode ser você mesmo). No presente parágrafo nos ocuparemos apenas com a cinemática em relação a um determinado observador (pontual). Faremos, a seguir, um ensaio de como é possível definir deslocamento
no espaço físico (denotaremos o espaço físico por ñ).
Queremos definir uma grandeza que descreva o deslocamento de uma partícula
entre quaisquer dois pontos A e B no espaço físico, conforme medido por um dado
observador O. Denotaremos provisoriamente essa grandeza por D(A, B), como significando: “deslocamento de A para B, conforme medido por O”. Essa grandeza possui
algumas propriedades importantes quanto à sua composição. Usaremos “” para in61
A regra de composição é fundamental.
•C •V •A •Ṕ •T •Ṕ. 101 •Ú •S
dicar essa composição (i.e., operação). Queremos que ela seja, por definição tal que:
D(P1 ,P2 ) D(P2 ,P3 ) = D(P1 ,P3 )
∀P2 ∈ ñ
(1.7)
∀P2 ∈ ñ
(1.8)
Dessa forma, temos que:
D(P1 , P2 ) D(P2 , P2 ) = D(P1 , P2 )
Que demonstra a seguinte propriedade: a operação definida em (1.7) possui elemento
neutro à direita. Ainda de (1.7), vale:
D(P1 , P1 ) D(P1 , P2 ) = D(P1 , P2 )
∀P1 ∈ ñ
(1.9)
logo, a operação possui também elemento neutro à esquerda. Das propriedades (1.7–1.9)
podemos demonstrar que a composição é associativa. Com efeito,
D(P1 ,P2 ) D(P2 ,P3 ) D(P3 ,P4 ) = D(P1 ,P2 ) D(P2 ,P4 )
= D(P1 ,P4 )
= D(P1 ,P3 ) D(P3 ,P4 )
= D(P1 ,P2 ) D(P2 ,P3 ) D(P3 ,P4 )
logo, temos que, ∀Pi ∈ ñ; i ∈ I4 ,
h
i h
i
D(P1 , P2 ) D(P2 , P3 ) D(P3 , P4 ) = D(P1 , P2 ) D(P2 , P3 ) D(P3 , P4 )
(1.10)
•C •V •A •Ṕ •T •Ṕ. 102 •Ú •S
De (1.7, 1.8 e 1.9), podemos tirar:
D(P1 , P1 ) = D(P1 , P2 ) D(P2 , P1 )
∀P1 ,P2 ∈ ñ
(1.11)
dessa forma, todo deslocamento possui simétrico diante da operação definida em (1.7).
Até aqui, estamos considerando apenas a composição de deslocamentos localizados,
isto é, o deslocamento D(A, B) está sendo entendido (até aqui) como um deslocamento
a partir do ponto A. Afim de levar para a estrutura algébrica dos deslocamentos a
propriedade comutativa e, além disso, para livrarmo-nos do aspecto localizado (que nos
referimos anteriormente), é importante que se defina a igualdade entre deslocamentos
por eqüipolência, isto é, tendo em vista a hipótese do espaço físico ser euclidiano
e considerando a seguinte propriedade (que definirá a igualdade por eqüipolência):
dados quaisquer pontos A, B, C e D no espaço físico
A=C e B=D
ou
AB, BD, DC e CA são lados de
D(A,B) = D(C,D) ⇔
um paralelogramo com AB k CD
ou
AB e CD são colineares e AB = CD.
(1.12)
Você pode verificar que as propriedades (1.7) e (1.12), juntas, são equivalentes à regra
do paralelogramo, i.e., à lei de composição de vetores.
•C •V •A •Ṕ •T •Ṕ. 103 •Ú •S
Agora, podemos demonstrar que a operação “ ” é comutativa. Diante de (1.7) e
(1.12) (ou seja, da regra do paralelogramo):
D(P1 , P2 ) D(P2 , P3 ) = D(P1 , A) D(A, P3 )
∀A ∈ ñ
daí, para qualquer ponto A tal que os segmentos P1 P2 , P2 P3 , P3 A e AP1 são lados de um
paralelogramo, por (1.12),
D(P1 , A) = D(P2 , P3 )
e
D(A, P3 ) = D(P1 , P2 )
e, daí segue-se que a operação “ ” é comutativa: [∀Pi ; i ∈ I3 ]
D(P1 , P2 ) D(P2 , P3 ) = D(P2 , P3 ) D(P1 , P2 )
(1.13)
As definições (1.7) e (1.12) já contêm uma estrutura algébrica bastante flexível (de
grupo comutativo); porém, é possível e conveniente definir outra “operação”62 , agora
entre o corpo dos reais (R, +, · ) e conjunto dos deslocamentos [munido da operação
“ ” com as propriedades (1.7) e (1.12)] de forma que teremos maior flexibilidade
para considerar a composição de deslocamentos com base em três deslocamentos não
coplanares no espaço físico. Consideraremos a seguinte definição, onde, para efeito de
notação, d(A, B) significará a distância entre os pontos A e B:
62 Usamos as aspas porque o termo operação não está sendo empregado no sentido em que foi definido no
§1.2.5. Talvez devêssemos ter usado o termo função, com domínio R×D e contradomínio D, onde D denota
o conjunto dos deslocamentos.
•C •V •A •Ṕ •T •Ṕ. 104 •Ú •S
∀α ∈ R, tem-se que α ∗ D(A, B) significa:
(i) um deslocamento no sentido de A para B,
de uma distância α · d(A, B), se α > 0 ;
(ii) um deslocamento no sentido de B para A,
(1.14)
de uma distância (−α) · d(A, B), se α < 0 ;
(iii) um deslocamento D(A, A), se α = 0.
É claro que, por essa definição e por (1.12), temos: ∀α, β ∈ R e ∀A, B ∈ ñ
1 ∗ D(A, B) ≡ D(A, B)
α ∗ β ∗ D(A, B) = α · β ∗ D(A, B) ,
uma vez que α ∗ β ∗ D(A, B) é um deslocamento de A para B, de uma distância
α · β · d(A, B) = α · β · d(A, B) .
(1.15)
(1.16)
Tendo em vista a associatividade do produto no corpo dos reais, então a propriedade
(1.16) se segue de (1.12). Temos ainda: ∀α, β ∈ R e ∀A, B ∈ ñ
(α + β) ∗ D(A, B) = [α ∗ D(A, B)] β ∗ D(A, B) ,
(1.17)
uma vez que ambos são deslocamentos na direção da reta definida pelos pontos A e B
de uma distância
(α+β) · d(A,B) = α · d(A,B) + β · d(A,B), se (a+b) > 0
•C •V •A •Ṕ •T •Ṕ. 105 •Ú •S
ou de uma distância
(−1) · (α+β) · d(A,B) = (−a) · d(A,B)+(−β) · d(A,B), se (a+b) < 0 .
Dessa forma, a propriedade (1.17) segue de (1.12) e, além disso,
α ∗ [D(A, B) D(B, C)] = [α ∗ D(A, B)] [α ∗ D(B, C)] ,
(1.18)
∀A, B, C ∈ ñ e ∀a ∈ R. Com efeito, sejam B0 e C0 dois pontos do espaço físico tais que:
D(A, B0 ) = α ∗ D(A, B)
e
D(B0 , C0 ) = α ∗ D(B, C) ,
logo o segmento AB é paralelo ao segmento AB0 , enquanto o segmento BC é paralelo
ao segmento B0 C0 . Como α·d(A, B) = d(A, B0 ) e d(B0 , C0 ) = α·d(B, C), então os triângulos ABC e
AB0 C0 são semelhantes e, daí,
α ∗ [D(A, B) D(B, C)] = α ∗ D(A, C)
= D(A, C0 )
= D(A, B0 ) D(B0 , C0 )
= [α ∗ D(A, B)] [α ∗ D(B, C)] ,
o que completa a demonstração de (1.18). De (1.14) é imediato que, ∀A, B ∈ ñ
(−1) ∗ D(A, B) ≡ D(B, A)
(1.19)
•C •V •A •Ṕ •T •Ṕ. 106 •Ú •S
A propriedade (1.11) dá uma maneira para se denotar o simétrico de um deslocamento
para a composição de deslocamentos.
Reavaliaremos as propriedades anteriores, enquadrando-as nos axiomas de espaço
vetorial:
. As propriedades (1.7), (1.12) e (1.14) são definições:
– (1.7) define a lei de composição (interna) para deslocamentos.
– (1.12) define a igualdade entre os deslocamentos.
– (1.14) define a operação externa, a saber: a “multiplicação” de um escalar63
por um deslocamento, tendo-se um deslocamento como “produto”.
. As seguintes propriedades caracterizam o conjunto de todos os deslocamentos,
munido de (1.7) e (1.12), como um grupo comutativo:
– Elemento neutro64 :
– Associatividade:
– Simétrico:
(1.8) e (1.9).
(1.10).
(1.11) e (1.19).
– Comutatividade:
(1.13).
63
Os elementos de um corpo são chamados escalares.
Observe que 0∗D(A, B) = D(A, A) = D(B, B) denotam, igualmente, o elemento neutro para a composição
de deslocamentos, quaisquer que sejam os pontos A e B.
64
•C •V •A •Ṕ •T •Ṕ. 107 •Ú •S
. Juntamente com as quatro propriedades do item anterior, as seguintes propriedades, envolvendo o produto de elemento do corpo por deslocamento, caracterizam
os deslocamentos65 como um espaço vetorial sobre o corpo dos reais:66
– 1 ∗ D(A, B) = D(A, B) ∀A, B ∈ ñ:
– Associatividade:
(1.15).
(1.16).
– Distributividade em relação à adição dos reais:
(1.17).
– Distributividade em relação à composição de deslocamentos:
(1.18).
Agora, considere dois sistemas de coordenadas cartesianas Oxyz e Ox0 y0 z0 (com a
mesma origem), de forma que a um ponto P do espaço físico corresponderá as coordenadas (x, y, z), no sistema Oxyz, e (x0 , y0 , z0 )0 , no sistema Ox0 y0 z0 . Considere ainda os
seguintes deslocamentos:
D1 ≡ D((0,0,0), (1,0,0))
D2 ≡ D((0,0,0), (0,1,0))
D ≡ D((0,0,0), (0,0,1))
3
e
0
D1 ≡ D((0,0,0)0 , (1,0,0)0 )
0
D2 ≡ D((0,0,0)0 , (0,1,0)0 )
D0 ≡ D((0,0,0)0 , (0,0,1)0 )
3
(1.20)
associados respectivamente a cada um dos sistemas de coordenadas. Neste ponto,
a definição (1.14) revela a sua importância, pois, qualquer que seja o deslocamento
65
66
Munidos das operações definidas em (1.7) e (1.14) e diante da definição (1.12).
Os itens destacados nessa ‘reavaliação’ são os axiomas de espaço vetorial, ver [32, pág. 12 e seguintes] e
[12].
•C •V •A •Ṕ •T •Ṕ. 108 •Ú •S
D(P1 , P2 ), isto é, quaisquer que sejam os pontos Pi de coordenadas (xi ,yi ,zi ), no sistema
Oxyz, e de coordenadas (x0i , y0i , z0i )0 , no sistema Ox0 y0 z0 , (i ∈ I3 ), temos (por (1.14) e (1.12),
respectivamente) que:
(
(x2 −x1 ) ∗ D1 = D ((0, 0, 0) , (x2 −x1 , 0, 0) ) = D ((x1 , 0, 0) , (x2 , 0, 0) )
(x0 −x0 ) ∗ D0 = D0 ((0, 0, 0)0 , (x0 −x0 , 0, 0)0 ) = D0 ((x0 , 0, 0)0 , (x0 , 0, 0)0 )
2
2
1
1
2
1
1
(
(y2 − y1 ) ∗ D2 = D ((0, 0, 0) , (0, y2 − y1 , 0) ) = D ((0, y1 , 0) , (0, y2 , 0) )
0
0
0
0
0
0
0
0
0
0
0
0
0
(y2 − y1 ) ∗ D2 = D ((0, 0, 0) , (0, y2 − y1 , 0) ) = D ((0, y1 , 0) , (0, y2 , 0) )
(
(z2 −z1 ) ∗ D3 = D ((0, 0, 0) , (0, 0, z2 −z1 ) ) = D ((0, 0, z1 ) , (0, 0, z2 ) )
(z0 −z0 ) ∗ D0 = D0 ((0, 0, 0)0 , (0, 0, z0 −z0 )0 ) = D0 ((0, 0, z0 )0 , (0, 0, z0 )0 ) .
2
2
1
1
2
3
1
Logo podemos escrever:
D(P1 , P2 ) = {(x2 −x1 )∗D1 } {(y2 − y1 )∗D2 } {(z2 −z1 )∗D3 }
= {(x0 2 −x0 1 )∗D0 1 } {(y0 2 − y0 1 )∗D0 2 } {(z0 2 −z0 1 )∗D0 3 }
(1.21)
Estamos mantendo a notação67 “ ” e “ ∗ ” (como indicadores das respectivas operações)
para ressaltar que são operações distintas: a primeira entre deslocamentos e a segunda
entre um número real e um deslocamento. Ambas resultando num deslocamento.
Além disso, queremos destacar que os deslocamentos e todas as propriedades levantadas
independem de qualquer sistema de coordenadas. Este ensaio tem como um dos objetivos
evidenciar essa independência.
67
Além da notação das operações do corpo.
•C •V •A •Ṕ •T •Ṕ. 109 •Ú •S
Quando adotamos um sistema de coordenadas, Oxyz ou Ox0 y0 z0 , estamos definindo
uma bijeção entre o conjunto de todos os deslocamentos de uma partícula no espaço
físico ñ e o R3 , a saber68 :
f : ñ → R3 ;
f (D(P1 , P2 )) = (x2 − x1 ,y2 − y1 , z2 − z1 )
ou
f 0 : ñ → R3 ;
f 0 (D(P1 , P2 )) = (x02 − x01 , y02 − y01 , z02 − z01 ) .
(1.22)
Podemos, então, definir a seguinte operação entre as ternas: (∀ai , bi , ci ∈ R ; i ∈ I2 )
(a1 ,b1 ,c1 ) ‡ (a2 ,b2 ,c2 ) ≡ (a1 + a2 ,b1 + b2 ,c1 + c2 )
e a seguinte operação externa:
(1.23)
(∀a, b, c, q ∈ R)
q † (a, b, c) ≡ (q · a, q · b, q · c)
e, agora, as ternas munidas das operações “ ‡ ” e “ † ” possuem as mesmas propriedades
(destacadas nos itens anteriores) que possuem os deslocamentos diante das operações
“ ” e “ ∗ ”, conforme pode ser verificado diretamente ou em vista das propriedades
algébricas que envolvem as funções f ou f 0 , que ficam automaticamente definidas com
a escolha do sistema de coordenadas. Isto é,
f (a ∗ D(P1 , P2 )) = a · (x2 − x1 ),a · (y2 − y1 ),a · (z2 − z1 )
= a † (x2 − x1 ),(y2 − y1 ),(z2 − z1 )
= a † f (D(P1 , P2 )) .
(1.24)
Estaremos, como de hábito, aliviando a notação: P(i) = Pi , x(i) = xi , etc. Nesse sentido, u(i) = ui deve ser
lido como “u índice i”.
68
•C •V •A •Ṕ •T •Ṕ. 110 •Ú •S
E ainda,
f (D(P1 , P2 D(P2 ,P3 ))) =
= f (D(P1 , P3 ))
= (x3 − x1 ,y3 − y1 ,z3 − z1 )
= (x3 − x2 ) + (x2 − x1 ), (y3 − y2 ) + (y2 − y1 ), (z3 − z2 ) + (z2 − z1 )
= (x2 − x1 ,y2 − y1 ,z2 − z1 ) ‡ (x3 − x2 ,y3 − y2 ,z3 − z2 ) .
Daí
f (D(P1 , P2 D(P2 , P3 ))) = f (D(P1 , P2 )) ‡ f (D(P2 , P3 )) .
(1.25)
Observe-se atentamente cada uma das quatro operações envolvidas nas duas últimas
equações, (1.24) e (1.25). Uma bijeção que possui essas propriedades algébricas, isto
é, que mantém a estrutura algébrica do domínio da função no seu contradomínio, é
chamada de um isomorfismo (ver §1.2.8, pág. 48). Note-se que, em vista das operações
definidas no domínio correspondente e das operações definidas no contradomínio da
função, tanto faz operar com objetos do domínio ou com objetos do contradomínio,
pois, os resultados das operações estão sempre relacionados aos respectivos operandos
mediante o isomorfismo.
Deixamos como exercício mostrar que, por (1.21)–(1.23), a bijeção f 0 também é um
isomorfismo, bem como as seguintes funções compostas (bijeções):
f 0 ◦ f −1 : R3 → R3
f −1 ◦ f 0 : ñ → ñ
0−1
3
3
f◦ f :R →R
f 0−1 ◦ f : ñ → ñ .
•C •V •A •Ṕ •T •Ṕ. 111 •Ú •S
Todas essas características serão mantidas se tomarmos um terceiro sistema de coordenadas Ox00 y00 z00 e definirmos:
00 00
00 00
00 00
f 00 : ñ → R3 ; f 00 (D(P1 , P2 )) = (x00
2 − x1 , y2 − y1 , z2 − z1 )
com as ternas munidas das operações “ ‡ ” e “ † ”. Note-se ainda que a composição
de funções é associativa, além do que também são isomorfismos as seguintes funções
f 00 ◦( f 0 −1 ◦ f ) : ñ → R3 , etc.
O objetivo desses comentários é convencer o estudante que a cada sistema de coordenadas corresponde uma ‘representação’ distinta para os deslocamentos. Essas representações estão relacionadas de forma bem definida, independentemente do sistema
de coordenadas adotado em ñ. Observe, por exemplo, f 0 ◦ f −1 . O objeto físico associado
a um deslocamento é um elemento de ñ, e não um elementos de R3 , podemos fazer uso
desses para representar aqueles (não apenas como um objeto mas, também, diante das
operações algébricas envolvidas).
Pelo que já discutimos, a adoção de um sistema de coordenadas Oxyz define:
. as ternas (x, y, z),
. uma função f , como na equação (1.22), e
. os vetores base D1 , D2 e D3 ,
de modo que, por meio da função f , P1 7→ (x1 , y1 , z1 ) e P2 7→ (x2 , y2 , z2 ). Dessa forma,
D(P1 , P2 ) = ((x2 − x1 ) ∗ D1 ) (y2 − y1 ) ∗ D2 ((z2 − z1 ) ∗ D3 ) .
(1.26)
•C •V •A •Ṕ •T •Ṕ. 112 •Ú •S
Estamos querendo chamar atenção para o fato que, em muitas oportunidades, costuma-se escrever
D(P1 , P2 ) = f (D(P1 , P2 )) = (x2 − x1 ,y2 − y1 ,z2 − z1 ),
(1.27)
deixando-se de lado um ‘purismo’ pedante e desnecessário, em vista do isomorfismo
estabelecido pela bijeção f . Quando o fazemos, devemos ter sempre em mente o seu
real significado; a “igualdade” da equação (1.27) deve ser entendida pelo significado
do que está escrito na equação (1.22).
Agora, passaremos a uma notação mais usual, muito embora os símbolos empregados para denotar as operações não distingam o conjunto no qual está definida a
operação. Essa distinção estará sempre implícita, isto é, “confundiremos” “ ‡ ” com
“ ” e com “ + ”; enquanto “confundiremos” também “ ∗ ” com “ † ” e com “ · ”.
Notação A posição de um ponto no espaço físico não é uma grandeza vetorial; porém,
tomando um ponto como “origem para os deslocamentos”, por exemplo a posição do
observador O, podemos então considerar
|ri i ≡ D(O, Pi )
(1.28)
como sendo o vetor posição do ponto Pi em relação ao ponto O, e podemos definir:
a ∗ D(O, P) ≡ a|ri
D(O, P1 ) D(O, P2 ) ≡ |r1 i + |r2 i
•C •V •A •Ṕ •T •Ṕ. 113 •Ú •S
e, dessa forma, podemos definir ainda,
∆|ri ≡ D(O, P2 ) (−1) ∗ D(O, P1 )
= D(O, P2 ) D(P1 , O)
= D(P1 , O) D(O, P2 )
= D(P1 , P2 )
e, usando (1.28), podemos escrever:
∆|ri = |r2 i + (−1)|r1 i = |r2 i − |r1 i .
Podemos, ainda, definir:
|ii ≡ D1 = D(O, (1,0,0)) ,
|ji ≡ D2 = D(O, (0,1,0)) ,
|ki ≡ D3 = D(O, (0,0,1)) .
Assim, obtemos a forma usual: (para “b0i ”, lê-se: bê linha índice i)
∆|ri = (x2 − x1 ) |ii + y2 − y1 |ji + (z2 − z1 ) |ki
= x02 − x01 |i0 i + y02 − y01 | j0 i + z02 − z01 |k0 i ,
(1.29)
(1.30)
•C •V •A •Ṕ •T •Ṕ. 114 •Ú •S
onde, em termos da representação associada ao sistema Ox0 y0 z0 ,
|i0 i ≡ D01 = D(O, (1,0,0)0 ) ,
| j0 i ≡ D02 = D(O, (0,1,0)0 ) ,
|k0 i ≡ D03 = D(O, (0,0,1)0 ) .
A equação (1.29) é equivalente à equação (1.26), enquanto (1.30) sublinha o fato
que ∆|ri independe da base D1 , D2 , D3 , ou seja, de |ii, | ji, |ki, ou ainda, do sistema de
coordenadas cartesiana Oxyz que se adote.
A notação |ri para um vetor não é a mais usual em cursos de física clássica, usa-se
denotar ~r como alternativa para |ri, e ainda: ı̂ = |ii, ̂ = |ji e k̂ = |ki.
Se a validade de qualquer equação (ou de qualquer lei) física que envolva grandezas
vetoriais dependesse de um sistema de coordenadas em particular, então essa equação
(ou lei) serviria para coisa nenhuma.
1.6.
Corpo dos complexos
Na história dos conceitos da Matemática, é bem provável que o de número natural (N)
tenha sido a primeira grande concepção. Depois, devem ter sido criadas as operações
de adição e de subtração. Para que toda subtração tivesse ‘solução’ devem ter criado os
números inteiros (Z). Depois, deve ter sido criada a operação de multiplicação (em N e
em Z). Com a operação inversa, a divisão, sentiu-se a necessidade de se considerar um
conjunto mais amplo para que todas as equações de primeira ordem com coeficientes
•C •V •A •Ṕ •T •Ṕ. 115 •Ú •S
em Z tivessem solução. Criou-se o conjunto dos racionais (Q) que pode ser definido
como
(
)
a
a
ka Q = z = ; a, b ∈ Z, b , 0 e z1 = z2 ⇒ z1 = e ∃k ∈ Z−{0}; z2 =
.
b
b
kb
Tacitamente, estamos considerando o zero como um inteiro. Aqui vale a pena comentar
que alguns autores consideram o zero como um elemento de N, outros não o consideram
como um número natural (principalmente os que fazem uso dos axiomas de Peano; ver
Apêndice A, pág. 332 e [18, Cap. 2, §1]). Com o conceito de multiplicação deve ter
vindo o de potenciação e o de raiz quadrada... Após o teorema de Pitágoras (§2.2,
√
pág. 134), provavelmente, passou a ser importante “coisas” como 2 (§A.1, pág. 335).
Muito tempo devem ter “gasto” com a discussão sobre a existência ou não existência
√
de 2; seria um número? como ficaria a diagonal de um quadrado de lado unitário?
Isso deve, então, ter motivado a criação dos números irracionais que, juntamente com
o racionais, formam o conjunto dos reais (R).
Com o desenvolvimento da álgebra surge a questão de algumas equações algébricas
com coeficientes reais, relativamente simples, que não possuem solução em R, por
exemplo x2 +1 = 0. Inicialmente, para dar solução a questão das soluções das equações
algébricas, foram criados os números complexos, i.e., os elementos do conjunto
(
(
))
a=c
2
C = z = a+i b ; a, b ∈ R, i = −1 e a+i b = c+i d ⇒
.
b=d
•C •V •A •Ṕ •T •Ṕ. 116 •Ú •S
Na segunda parte da definição está também definida a relação de igualdade entre os
complexos.
Para o conjunto C, podemos definir as operações de adição e multiplicação, induzidas
das operações correspondentes do corpo dos reais, de tal forma que, dados z1 = a1 +i b1
e z2 = a2 +i b2 ,
z1 + z2 = (a1 + a2 ) + i (b1 + b2 )
z1 · z2
= (a1 · a2 − b1 · b2 ) + i (a1 · b2 + a2 · b1 ) .
É fácil verificar que a terna (C, +, · ) é um corpo, conhecido como corpo dos complexos.
Uma dificuldade inicial que pode ocorrer é determinar o inverso multiplicativo de um
complexo não-nulo, com efeito, seja z = a + i b, tal que a, b ∈ R − {0}, então seu inverso
multiplicativo é
1
=x+iy,
a + ib
em que devemos determinar os reais x e y, portanto:
1 = ax − by + i bx + a y ,
daí:
ax − by = 1
bx + ay = 0 ⇒
então
ax +
b2 x
=1
a
⇒
y = −bx/a ,
x a2 + b2 = a
•C •V •A •Ṕ •T •Ṕ. 117 •Ú •S
de onde tiramos
x=
a
a 2 + b2
y=
−b
a 2 + b2
e, daí,
logo, se a2 +b2 , 0, o inverso multiplicativo de (z = a + i b) é o complexo
(a + i b)−1 =
−b
a
+i 2
a2 + b2
a + b2
(1.31)
o qual se denota por z−1 ou por 1z , ou ainda por 1/z. Antes de prosseguirmos, e
para completar a demonstração da propriedade anteriores, devido a sua importância
intrínseca, cabe registrar formalmente o seguinte teorema:
Teorema 1.6.1. Dado z = a+i b, então a2 +b2 = 0 ⇔ z = 0.
Prova. Ora,
1. se z = 0, então a = 0 e b = 0, daí a2 + b2 = 0;
2. se (a2 + b2 ) = 0, então a2 = −b2 ; como a e b são reais e como o único número real
que é simultaneamente positivo e negativo é o zero, então a = b = 0.
O que completa a demonstração da proposição.
•C •V •A •Ṕ •T •Ṕ. 118 •Ú •S
No corpo dos complexos, a equação x2 = −1 admite duas soluções: x = i ou x = − i.
Além disso, o subconjunto do conjunto dos complexos tais que z = a + i 0 é igual ao
conjunto dos reais, i.e.,
n
o
z = a + i0 ; z ∈ C = R.
Costuma-se escrever z = a+i 0 = a; portanto z = 1 é o elemento neutro da multiplicação e z = 0
é o elemento neutro da adição. Além disso, o complexo z = 0+i 1 = i é chamado unidade
imaginária.
Definição 1.6.1. Dado z = a+i b, chama-se:
Im(z) ≡ b : parte imaginária de z
Re(z) ≡ a : parte real de z.
Seja z = a+i b. Como a, b ∈ R, então a2 +b2 ≥ 0. Além disso, a proposição 1.6.1 garante
que a2 + b2 = 0 se, e somente se, z = 0. Desse modo, a grandeza a2 + b2 , associada ao
complexo z, é positiva definida, conforme requer qualquer norma. Isso motiva a seguinte
definição: (ver nota à pág. 90)
Definição 1.6.2. Dado um complexo qualquer z = a+i b, a sua norma |z| é definida pela
forma positiva definida:
√
|z| ≡ + a2 + b2
∀z = a + ib ∈ C.
Essas últimas definições nos levam a considerar:
•C •V •A •Ṕ •T •Ṕ. 119 •Ú •S
Definição 1.6.3. A bijeção em C que a cada z = a+i b ∈ C associa o complexo z̄ = a−i b é
chamada conjugação complexa; diz-se que z̄ é o complexo conjugado de z.
As seguintes propriedades são imediatas:
|z|2 = z · z̄
z + z̄ = 2 Re(z)
z − z̄ = 2 i Im(z)
Também é simples demonstrar que69 :
69
Demonstração para (1.32–1.34):
z1 + z2 = (a1 + i b1 ) + (a2 + i b2 ) = (a1 + a2 ) + i(b1 + b2 )
= (a1 + a2 ) − i(b1 + b2 ) = (a1 − i b1 ) + (a2 − i b2 )
= z̄1 + z̄2 .
z1 · z2 = (a1 + i b1 ) · (a2 + i b2 )
= (a1 a2 − b1 b2 ) + i(a1 b2 − a2 b1 )
= (a1 a2 − b1 b2 ) − i(a1 b2 − a2 b1 )
= (a1 a2 − (−b1 )(−b2 )) + i (a1 (−b2 ) + a2 (−b1 ))
= z̄1 · z̄2 .
|z1 z2 |2 = (z1 z2 ) · (z1 z2 ) = z1 z2 · z̄1 z̄2 = (z1 z̄1 ) · (z2 z̄2 )
= |z1 |2 · |z2 |2 .
•C •V •A •Ṕ •T •Ṕ. 120 •Ú •S
z1 + z2 = z̄1 + z̄2
z1 · z2 = z̄1 · z̄2
|z1 · z2 | = |z1 | · |z2 | .
(1.32)
(1.33)
(1.34)
Estamos em condições para provar um resultado fundamental:
Teorema 1.6.2 (Desigualdade do Triângulo).
|z1 + z2 | ≤ |z1 | + |z2 |
∀z1 , z2 ∈ C .
Prova.
|z1 + z2 |2 = (z1 + z2 ) (z1 + z2 )
= |z1 |2 + |z2 |2 + (z1 z̄2 ) + (z2 z̄1 )
= |z1 |2 + |z2 |2 + (z1 z̄2 ) + (z1 z̄2 )
= |z1 |2 + |z2 |2 + 2Re(z1 z̄2 )
= |z1 |2 + |z2 |2 + 2|z1 ||z2 | − 2|z1 ||z2 | + 2Re(z1 z̄2 )
= (|z1 | + |z2 |)2 − 2|z1 ||z2 | + 2Re(z1 z̄2 )
= (|z1 | + |z2 |)2 + 2 {Re(z1 z̄2 ) − |z1 ||z2 |}
como |z| ≥ |Re(z)|, ∀z ∈ C, então |z1 +z2 |2 ≤ (|z1 |+|z2 |)2 .
•C •V •A •Ṕ •T •Ṕ. 121 •Ú •S
Problema Dados z = a+i b e u = c+i d, determine w = z·u−1 = uz no caso de u , 0.
A continuar nos §§ 2.13 e 2.14
Resolvemos desenvolver outros aspectos sobre o corpo dos complexos, tais como representação polar e representação exponencial, após discutirmos as funções trigonométricas, função logaritmo e a função exponencial. A continuidade do presente parágrafo
está no §2.13, pág. 207, e no §2.14, pág. 210. Queremos deixar bem justificada e bem
entendida a representação polar (§2.13) e a representação exponencial (§2.14) para um
número complexo, bem como quanto à sua utilidade para o trato com as chamadas funções trigonométricas, funções hiperbólicas, com as equações diferenciais, osciladores,
ondas, etc.
•C •V •A •Ṕ •T •Ṕ. 122 •Ú •S
Capítulo 2
Estudo de Algumas Funções
Elementares
Neste capítulo, a menos que explicitamente indicado, estaremos considerando o corpo
dos reais (R, +, · ). Quando dizemos que o domínio ou o contradomínio de uma função
é o corpo dos reais, isso significa que as operações definidas entre os elementos do
domínio ou do contradomínio são as operações definidas para esse corpo.
•C •V •A •Ṕ •T •Ṕ. 123 •Ú •S
Introdução
Dado um corpo (K, +, · ) e dada uma função f : K → K, as raízes de f definem o subconjunto do domínio S = {x ; x ∈ K e f (x) = 0}, i.e., o conjunto contido no domínio dos
elementos cuja imagem é o elemento neutro aditivo do corpo. Uma expressão f (x) = 0 é
chamada equação na incógnita x.
Seja f uma função com domínio no corpo dos reais, dizemos que:
1. f é uma função periódica se (e somente se) existir um real positivo T tal que
f (x + T) = f (x), qualquer que seja x ∈ R; se T for o menor real positivo com essa
propriedade, dizemos que T é o período da função f ;
2. f é uma função par se f (−x) = f (x), qualquer que seja x ∈ R;
3. f é uma função ímpar se f (−x) = − f (x), qualquer que seja x ∈ R.
Introduziremos o que se entende por soma e por produto de funções. Dadas duas
funções f : A → B e g : A → B, sendo A e B subconjuntos de R, definimos1 :
1. função produto: f ·g : A → B, tal que ( f ·g)(x) ≡ f (x)·g(x) ∀x ∈ A, também denotada por2
( f g)(x), e
1
2
Observa-se que as duas funções possuem domínios iguais e contradomínios iguais.
Não deve ser confundida com a função composta.
•C •V •A •Ṕ •T •Ṕ. 124 •Ú •S
2. função soma: f + g : A → B tal que3 ( f + g)(x) ≡ f (x) + g(x) ∀x ∈ A.
Quando nos referirmos à soma de funções ou ao produto de funções, estará implicitamente
entendido que o domínio das funções envolvidas é o mesmo; se esse não for especificado, deve ser entendido (usando-se a regra do domínio máximo) como a intersecção
dos respectivos domínios.
Deve-se observar que uma função periódica não pode ser injetiva, portanto não existe
a função inversa a ela associada. Podemos particularizar a definição de função par ou
de função ímpar para funções com domínio simétrico em relação ao zero, isto é, funções
cujo domínio seja um conjunto A ⊂ R tal que a ∈ A ⇒ −a ∈ A, qualquer que seja a ∈ A. A
função f (x) = c (sendo c uma constante) é uma função par, porém a função f (x) = 0 é a
única função que é simultaneamente par e ímpar. Devido a importância dessas funções
em física, provaremos algumas propriedades relevantes.
Teorema 2.0.3. Qualquer função com domínio em R pode ser expressa como a soma
de uma função par e uma função ímpar.
Prova. Dada f : R → R, estão definidas as duas funções:
( f (x)+ f (−x))
e
( f (x)− f (−x)) ,
daí, em vista da identidade:
f (x) =
f (x) + f (−x)
f (x) − f (−x)
+
.
2
2
3 Pode ser verificado que o conjunto das funções f : A → B, com A, B ⊂ K, munido das operações de
adição de funções e de multiplicação de funções formam um espaço vetorial (de dimensão finita) sobre o corpo
(K, +, · ).
•C •V •A •Ṕ •T •Ṕ. 125 •Ú •S
a proposição está demonstrada, uma vez que α(x) = f (x) + f (−x) é uma função par 4 e
β(x) = f (x) − f (−x) é uma função ímpar 5 .
Teorema 2.0.4. O produto de duas funções pares ou de duas funções ímpares é uma função
par.
Prova. Se f e g são duas funções pares, então
f (−x) · g(−x) = f (x) · g(x)
f (−x) + g(−x) = f (x) + g(x)
e, portanto, o produto e a soma são funções pares. Se f e g forem funções ímpares,
então
f (−x) · g(−x) = (− f (x)) · (−g(x)) = + f (x) · g(x)
f (−x) + g(−x) = − f (x) − g(x) = − f (x) + g(x)
e, portanto, o produto é uma função par e a soma é uma função ímpar.
Também ficou demonstrada a seguinte proposição:
Teorema 2.0.5. A soma de duas funções pares é uma função par e a soma de duas
funções ímpares é uma função ímpar.
4
5
f (−{x}) + f (−{−x}) = f (−x) + f (x) = f (x) + f (−x) .
f (−{x}) − f (−{−x}) = f (−x) − f (x) = −[ f (x) + f (−x)] .
•C •V •A •Ṕ •T •Ṕ. 126 •Ú •S
Temos ainda a seguinte propriedade:
Teorema 2.0.6. O produto de uma função par com uma função ímpar é uma função
ímpar.
Prova. Seja f uma função par e g uma função ímpar, então
f (−x) · g(−x) = f (x) · (−g(x)) = −( f ·g)(x)
Portanto a função produto ( f ·g)(x) é ímpar.
Teorema 2.0.7. A derivada de uma função par (derivável) é uma função ímpar; a
derivada de uma função ímpar (derivável) é uma função par.
Prova. Se y = f (x) é uma função derivável par, então (ver Apêndice B, pág. 338)
df
f (x + ∆x) − f (x)
= lim
= g(x) ,
dx ∆x→0
∆x
•C •V •A •Ṕ •T •Ṕ. 127 •Ú •S
dessa forma,
f (−x+∆(−x)) − f (−x)
∆(−x)
f (−(x + ∆x)) − f (−x)
= lim
∆x→0
∆(−x)
f (x + ∆x) − f (x)
= lim
∆x→0
−∆x
f (x + ∆x) − f (x)
= − lim
∆x→0
∆x
= −g(x) ;
g(−x) = lim
∆x→0
a demonstração para o caso das funções ímpares fica como problema.
Observa-se que, se f (x) é uma função par [ou ímpar], a derivada de f (x)+c (sendo c uma
constante aditiva) é uma função ímpar [ou par], isso se deve ao fato de a função g(x) = 0
ser tanto par quanto ímpar.
Teorema 2.0.8. Se f (x+T) = f (x) (qualquer que seja x real), então
f (x + nT) = f (x) ,
∀n ∈ Z e ∀ ∈ R .
Prova. Usaremos indução matemática (ver apêndice A, pág. 332):
1. se n = 0, temos a identidade f (x) = f (x), para todo real x;
•C •V •A •Ṕ •T •Ṕ. 128 •Ú •S
2. se n = 1, temos a definição de função periódica, condição que é satisfeita pela
hipótese da proposição;
3. se a proposição é válida para n = m, então
f (x + (m + 1)T) = f ((x + mT) + T) = f (x + mT) = f (x) ,
logo é válida para qualquer n ∈ N;
4. se a proposição é válida para n = m, então
f (x) = f (x)
⇒
f ((x − m T) + m T) = f (x) = f (x + mT) ,
logo f (x−mT) = f (x), qualquer que seja x nos reais,
portanto a proposição é válida para qualquer m ∈ Z.
Teorema 2.0.9. Se f1 (x) é uma função periódica de período T1 e se f2 (x) é outra função
periódica de período T2 , então a função produto, ( f1 · f2 )(x), e a função soma, ( f1 + f2 )(x),
serão periódicas quando T1 e T2 forem comensuráveis6 .
Prova. Da hipótese, f1 (x+T1 ) = f1 (x) e f2 (x+T2 ) = f2 (x), qualquer que seja x ∈ R, além
disso, da comensurabilidade entre T1 e T2 , existem inteiros (não-nulos) m, n tais que
6
Dizemos que dois reais (não-nulos) a e b são comensuráveis se existem inteiros (não-nulos) m e n tais que:
ma = nb.
•C •V •A •Ṕ •T •Ṕ. 129 •Ú •S
mT1 = nT2 = T, portanto:
f1 (x + T1 ) + f2 (x + T2 ) = f1 (x + mT1 ) + f2 (x + nT2 )
= f1 (x + T) + f2 (x + T).
A prova para o caso da função produto é análoga e a deixamos como problema.
Se, para as funções f1 e f2 do Teorema 2.0.9, T1 e T2 são comensuráveis e se |m| e |n|
são os menores naturais com a propriedade mT1 = nT2 , então o período da função soma
( f1 + f2 ) e da função produto ( f1 · f2 ) é: T = |m|T1 = |n|T2 .
Teorema 2.0.10. A derivada de uma função periódica diferenciável também é periódica, e
ambas possuem o mesmo período.
Prova. Seja T o período uma função periódica y = f (x), então f (x+T) = f (x), para todo
x ∈ R. Daí
f ((x + T) + ∆x) − f (x + T)
d f = lim
∆x→0
dx ∆x
(x+T)
f ((x + ∆x) + T) − f (x)
∆x
f (x + ∆x) − f (x)
= lim
∆x→0
∆x
d f =
∀x ∈ R .
dx (x)
= lim
∆x→0
•C •V •A •Ṕ •T •Ṕ. 130 •Ú •S
2.1.
Função do primeiro grau
Dados dois reais a , 0 e b, uma função do primeiro grau ou uma função linear (o termo
função afim também é empregado) é uma função real f : R → R tal que x 7→ ax+b, a qual
costumamos indicar:
y = ax + b
(2.1)
Essa função possui apenas uma raiz: x = −b/a, e sua derivada é:
df
[a(x + ∆x) + b] − [ax + b]
= lim
dx ∆x→0
∆x
a ∆x
= lim
∆x→0 ∆x
= lim a = a, portanto
∆x→0
df
= a.
dx
Esse resultado, tão conhecido, remete-nos a uma propriedade importante da geometria
elementar. Com efeito. Sejam dois pontos distintos quaisquer x1 e x2 , por meio de (2.1),
temos:
f (x1 ) − f (x2 ) ax1 − ax2
=
= a.
(2.2)
x1 − x2
x1 − x2
•C •V •A •Ṕ •T •Ṕ. 131 •Ú •S
Para um ponto genérico dessa função (x, y = f (x)), conhecidos a e um ponto (x0 , y0 = f (x0 )),
teremos
y − y0
=a.
(2.3)
x − x0
Essa relação é outra forma equivalente de expressar a função (2.1). Nesse sentido,
conhecer a e b é equivalente a conhecer: a e y0 = f (0) = b.
Se considerarmos o plano cartesiano xOy (com escalas lineares idênticas para os dois
eixos), a razão constante em (2.3) diz que a representação geométrica da função y = ax+b
será uma reta, sendo a uma razão de semelhança entre lados correspondentes (paralelos
aos eixos coordenados) de uma família de triângulos semelhantes, logo a representação
geométrica dessa função será uma reta que passa pelo ponto (x = 0, y = b) e cuja direção
está determinada pela razão de semelhança expressa por (2.3), o chamado coeficiente
angular da reta7 . Voltaremos a discutir alguns aspectos geométricos nos próximos
parágrafos. Concluiremos com a chamada equação paramétrica da reta.
Seja t um parâmetro real. Considerando x = α1 t+β1 , então, de (2.1),
y = aα1 t + (aβ1 + b).
Portanto, considerando α2 = aα1 e β2 = b+aβ1 , as equações paramétricas
x = α1 t + β1
y = α2 t + β2
7
Conforme veremos no §2.4, esse coeficiente angular é numericamente igual à tangente trigonométrica do
ângulo definido pela reta e pelo eixo Ox.
•C •V •A •Ṕ •T •Ṕ. 132 •Ú •S
constituem outra forma equivalente de representar a função (2.1), sendo
α1
α2
e b = β2 − β1
.
a=
α2
α1
A equação da reta permite escrever a relação (2.2), a qual é válida quaisquer que
sejam os pontos distintos da reta: P1 ≡ (x1 , f (x1 )) e P2 ≡ (x2 , f (x2 )), conforme ilustra a Fig. 2.1. Outras relações análogas ainda podem ser obtidas para os triângulos retângulos
semelhantes ao triângulo AP1 P2 (conforme veremos mais adiante).
Figura 2.1: Uma reta no plano xOy; observe que
y
AP2
AP1
= a.
6
P2
y2
P1 y1
b
O
x1
A
x2
-
x
Antes de qualquer outra consideração, demonstraremos o tão conhecido, importante e fundamental teorema de Pitágoras.
•C •V •A •Ṕ •T •Ṕ. 133 •Ú •S
2.2.
Teorema de Pitágoras (uma demonstração)
Teorema 2.2.1 (Pitágoras). Se a é a hipotenusa de um triângulo retângulo, sendo b e c
seus catetos, então a2 = b2 +c2 .
Prova. Considerando um triângulo retângulo qualquer, de lados a, b e c, conforme indicado8 na Fig. 2.2, podemos construir dois quadrados, um com lado a e outro obtido
a partir do prolongamento dos catetos. Como a soma dos ângulos internos de um
triângulo qualquer é igual a π rad (cuja demonstração é muito simples, basta considerar
um triângulo qualquer e tirar por um dos vértices uma paralela ao lado oposto), então
todos os triângulos que aparecem na figura são semelhantes, e mais: como a hipotenusa
é igual a a, então o lado do quadrado externo é igual a b+c. A área do quadrado de lado
a é a2 , a do de (b+c) é (b+c)2 e a de cada triângulo retângulo é 12 (bc). Tira-se da Fig. 2.2
que
h
i
a2 = (b + c)2 − 4 12 (bc)
= b2 + c2 + 2bc − [2bc]
a2 = b2 + c2 ,
que prova o teorema de Pitágoras, ou ainda:
9
8 Chama-se o comprimento do lado oposto ao ângulo reto de hipotenusa e os comprimentos dos outros
dois lados de catetos, esses termos são empregados para se referir aos lados de um triângulo retângulo, i.e.,
aos segmentos de reta que constituem o triângulo retângulo.
9 O teorema de Pitágoras admite ainda outras demonstrações.
•C •V •A •Ṕ •T •Ṕ. 134 •Ú •S
c
b
!
!! L
!
c
L
!!a
L
!!
!
b
L
aL
L
L
L
L
L
L
a
b
L B
L
L
a
L
c
L
c
C
b
A
Figura 2.2: Teorema de Pitágoras: a2 = b2 +c2 .
•C •V •A •Ṕ •T •Ṕ. 135 •Ú •S
√
a=
b2 + c2 .
Já que tratamos do teorema da soma dos ângulos internos de um triângulo (este
com indicação de um caminho de prova alternativa) e do de Pitágoras aproveitamos
para apresentar mais algumas questões úteis de geometria euclidiana.
Teorema 2.2.2 (do ângulo inscrito). Um ângulo inscrito em um círculo é igual à metade
do correspondente ângulo central.
d inscrito no círculo de centro O e raio R; e seja também o
Prova. Seja o ângulo ABC
[ Veja Fig. 2.3. Traçando o segmento OA obtemos
correspondente ângulo central AOC.
[ = ABO
[ = α1
o triângulo isósceles OAB, uma vez que AO = OB = OC = R, então BAO
são ângulos iguais e daí, pelo teorema da soma dos ângulos internos de um triângulo,
[ = α1+α1 = 2α1 . Analogamente OBC
[ = BCO
[ = α2 e daí AOC
[ = α2+α2 = 2α2 . Finalmente
AOD
d = α1 +α2 é a metade do ângulo central AOC
[ = 2(α1 +α2 ).
o ângulo inscrito ABC
Arco capaz Uma conseqüência dessa proposição é que o segmento de arco de círculo
AC que contém o ponto B é o lugar geométrico dos vértices V dos triângulos ACV tais
[ = ABC
d = γ; esse lugar geométrico é conhecido como arco capaz do ângulo γ
que AVC
associado ao segmento de reta AC. É análogo provar que o seu segmento de círculo
complementar, i.e., o que contém o ponto D da Fig. 2.3, é o arco capaz do ângulo δ = π−γ.
Em www.cut-the-knot.org/pythagoras/index.shtml são apresentadas 44 demonstrações alternativas.
•C •V •A •Ṕ •T •Ṕ. 136 •Ú •S
[ é igual ao dobro do ângulo inscrito ABC
d = γ = α1+α2 .
Figura 2.3: O ângulo central AOC
•C •V •A •Ṕ •T •Ṕ. 137 •Ú •S
Outra conseqüência é que o semi-circulo é o lugar geométrico dos vértices dos
triângulos retângulos que têm por hipotenusa o diâmetro do circulo (o teorema de
Thales10 ); é o arco capaz de 90◦ .
Para traçar o arco capaz do ângulo genérico γ associado ao segmento de reta AC
basta considerar:
1. o cento O do círculo estará na mediatriz do segmento de reta AC, mediatriz que
define o ponto M, o ponto médio do segmento.
2. o ângulo central será 2γ, daí
[ = γ, portanto
3. o triângulo AOM é retângulo em M e AOM
[ = π−γ, daí
4. OAM
5. tirando uma reta por A que faça o ângulo γ com AC, essa será a reta tangente ao
círculo e sua perpendicular passa por O, o que define o centro do arco capaz.
6. O ponto O0 da mediatriz de AC e simétrico a O é outro centro do círculo lugar
geométrico do ângulo γ para o segmento AC.
A título de exercício, determine o arco capaz de 60◦ de um segmento AC.
Veja na pág. 173 uma demostração alternativa para a lei dos senos.
10 Thales
de Miletus (624AC–547AC), filósofo grego.
•C •V •A •Ṕ •T •Ṕ. 138 •Ú •S
2.3.
Razões de semelhança em um triângulo retângulo e
as funções trigonométricas
A importância dos triângulos retângulos está neles próprios e no fato de todo triângulo
poder ser dividido em dois triângulos retângulos, basta que se tire a altura em relação
a um dos seus lados.
Seja Γ = {(x, y); y = ax+b} e θ o ângulo definido pela reta Γ e o eixo Ox. A reta Γ define
triângulos retângulos semelhantes tais que |x1−x| e |y1−y| são os catetos e, para os quais,
do teorema de Pitágoras,
q
α=
(x1 − x )2 + (y1 − y)2
é a hipotenusa correspondente, qualquer que seja o ponto P de coordenadas (x, y) em
Γ−{(x1 , y1 )}. Dessa forma, usando a identidade (2.3) para a reta Γ, podemos escrever:
2
y1 − y = a2 (x1 − x)2 .
(2.4)
Somando membro a membro (x1 − x)2 , temos:
(x1 − x)2 + (y1 − y)2 = a2 (x1 − x)2 + (x1 − x)2
α2 = a2 + 1 (x1 − x)2
daí
1
|x1 − x|
= √
q
1 + a2
(x1 − x)2 + y1 − y 2
(2.5)
•C •V •A •Ṕ •T •Ṕ. 139 •Ú •S
ou, alternativamente, somando membro a membro a2 (y1 − y)2 temos:
(y1 − y)2 + a2 (y1 − y)2 = a2 (x1 − x)2 + a2 (y1 − y)2
i
h
(1 + a2 ) (y1 − y)2 = a2 (x1 − x)2 + (y1 − y)2 ,
daí
y1 − y
p
(x1 −
x )2
+ (y1 −
y)2
= √
|a|
1 + a2
.
Além disso, dividindo membro a membro (2.6) por (2.5):
y1 − y
= |a| .
|x1 − x|
(2.6)
(2.7)
Em resumo, em relação a esses triângulos retângulos semelhantes, temos que:
1. a relação (2.5) diz: a razão entre o cateto adjacente ao ângulo θ e a hipotenusa é uma
constante;
2. a relação (2.6) diz: a razão entre o cateto oposto ao ângulo θ e a hipotenusa é uma
constante;
3. a relação (2.7) diz: a razão entre o cateto oposto e o cateto adjacente ao ângulo θ é
uma constante.
•C •V •A •Ṕ •T •Ṕ. 140 •Ú •S
Para triângulos retângulos teremos sempre: 0 < θ < π2 ; portanto, cada uma dessas razões
de semelhança definem, respectivamente, o seno trigonométrico, o cosseno trigonométrico e a tangente trigonométrica desse ângulo.
Nosso objetivo com este parágrafo é sublinhar a razão de semelhança entre os lados
dos triângulos retângulos. Nos próximos parágrafos definiremos as funções trigonométricas com domínio e contradomínio reais11 e demonstraremos as principais relações
entre as funções trigonométricas. Observe que a reta y = ax é paralela à reta y = ax+b e
que (0, 0) ∈ {(x, y) ; y = ax}. Logo y = ax passa pela origem e
(ax1 + b) − (ax2 + b) (ax1 ) − (ax2 )
=
=a
x1 − x2
x1 − x2
∀b ∈ R .
Dessa forma, para lidarmos com as razões de semelhança, tanto faz trabalhar com a
reta y = ax+b ou com a reta y = ax, ou mesmo com a reta y = ax+c (que expressam três
retas paralelas). Esse fato também pode ser observado por meio das razões (2.5), (2.6) e
(2.7) que dependem apenas do parâmetro a da reta Γ; independendo de b, isso significa
que essas razões são as mesmas para toda família de retas paralelas à reta Γ, ou seja de
todas as retas que definem o mesmo ângulo θ com o eixo Ox.
Nos parágrafos seguintes, a referência a um ângulo θ entre uma reta e um eixo
coordenado estará considerando implicitamente que os eixos coordenados possuem
escalas idênticas, de tal forma que a medida desse ângulo pode ser efetuada diretamente
no gráfico por meio de um transferidor; ou, para o caso em que se adota escalas diferentes
E não apenas no intervalo (0, π2 ) das grandezas trigonométricas da geometria, que envolvem razões entre
comprimentos.
11
•C •V •A •Ṕ •T •Ṕ. 141 •Ú •S
para os eixos coordenados, por meio do produto escalar de um vetor paralelo à reta e de
um vetor paralelo ao eixo (§2.5).
2.4.
Funções seno, cosseno e tangente
Dado um ponto qualquer do R2 e os eixos cartesianos xOy, fica definido um triângulo
retângulo com um vértice nesse ponto, com outro vértice na origem e o vértice correspondente ao ângulo reto no ponto (x, 0). Esse triângulo será degenerado em três
situações:
. quando x = 0, o triângulo degenera-se num segmento de reta sobre o eixo Oy;
. quando y = 0, o triângulo degenera-se num segmento de reta sobre o eixo Ox; ou
. quando esse ponto coincide com a origem, o triângulo degenera-se num ponto.
p
A hipotenusa desse triângulo (não-degenerado) será: a = x2 + y2 . Usaremos esses
triângulos no plano xOy para definir as funções trigonométricas e demonstrar as suas
principais relações.
Seja um ponto qualquer (x, y) ∈ R2−{(0, 0)} e seja θ o ângulo que o segmento definido
pelos pontos (x, y) e (0,0) forma com o eixo Ox. Definem-se as funções:
seno
sen : R → [−1, + 1] , tal que
y
;
sen(θ) ≡ p
2
x + y2
(2.8)
•C •V •A •Ṕ •T •Ṕ. 142 •Ú •S
cosseno
cos : R → [−1, + 1] , tal que
x
;
cos(θ) ≡ p
2
x + y2
tangente
tan : R → R , tal que
tan(θ) ≡
y
.
x
(2.9)
(2.10)
Em alguns casos, usa-se considerar a razão entre comprimentos de lados do triângulo,
quando define-se o seno, o cosseno e a tangente (trigonométricas) de um ângulo de um
triângulo retângulo como:
. o seno trigonométrico de um ângulo de triângulo retângulo é a razão entre o cateto
oposto ao ângulo e a hipotenusa;
. o cosseno trigonométrico de um ângulo de triângulo retângulo é a razão entre o cateto
adjacente ao ângulo e a hipotenusa;
. a tangente trigonométrica de um ângulo de triângulo retângulo é a razão entre o
cateto oposto ao ângulo e o cateto adjacente.
Nesse sentido as respectivas grandezas trigonométricas são expressos por reais positivos e os ângulos pertencem ao intervalo (0, π2 rad). Por outro lado, quando se está
considerando os pontos no R2 , passa-se a associar um valor relativo (i.e., um sinal) discriminando o quadrante no qual o ponto se encontra, além disso, o ângulo não está mais
•C •V •A •Ṕ •T •Ṕ. 143 •Ú •S
restrito ao intervalo (0, π2 rad) ⊂ R, uma vez que consideramos o seguinte significado:
se α ∈ [0, π2 rad], então:
α é um ângulo do primeiro quadrante;
θ = π2 +α é um ângulo do segundo quadrante;
θ = π+α é um ângulo do terceiro quadrante;
θ = 3π
2 +α é um ângulo do quarto quadrante.
Dizemos também que os ângulos β e θ, tais que β = 2kπ + θ, onde k ∈ N, são ângulos
côngruos.
As funções trigonométricas12 definidas no início deste parágrafo possuem relações
importantes e de fácil verificação (cuja demonstração deixamos como exercício):
Teorema 2.4.1. Qualquer que seja β ∈ R, são válidas as seguintes relações13 :
sen2 (β) + cos2 (β) = 1
sen(β)
tan(β) =
.
cos(β)
(2.11)
(2.12)
12 O uso de parênteses para o argumento das funções trigonométricas (ou de qualquer função transcendente) pode ser dispensado quando o argumento é uma única variável, porém, em programas de computador
o uso de parênteses é obrigatório (para quase todos programas).
13 É usual a notação: sen(β)· sen(β) = sen2 (β), cos(β)· cos(β) = cos2 (β), etc. Essa notação não deve ser
confundida com a expressão sen(sen(β)), que diz respeito à composição da função seno.
•C •V •A •Ṕ •T •Ṕ. 144 •Ú •S
A relação (2.11) é justamente o teorema de Pitágoras aplicado a um triângulo (retângulo) semelhante com hipotenusa igual a uma unidade de comprimento.
Observando as definições dadas para as três funções trigonométricas, tira-se de
imediato que θ = ( π2 −α) é o ângulo entre OP e o eixo Oy [dado o ponto P, localizado
pelo par (x, y), de tal forma que α é o ângulo definido por OP e pelo eixo Ox] e que,
além disso:
q
q
(2.13a)
x = x2 + y2 cos(α) = x2 + y2 sen( π2 − α)
q
q
(2.13b)
y = x2 + y2 sen(α) = x2 + y2 cos( π2 − α) .
Havendo alguma dúvida quanto às segundas igualdades, imagine a transformação de
coordenadas x0 = y e y0 = x, agora basta aplicar as definições das funções trigonométricas
e observar a relação entre os ângulos.
2.5.
Rotação dos eixos coordenados no plano
Como uma aplicação extremamente útil para as funções seno e cosseno, além de ótima
ilustração para o uso de matrizes, descreveremos a lei de transformação das coordenadas cartesianas de um ponto quando o sistema de coordenadas sofre uma rotação.
Nosso objetivo mais imediato é a determinação da expressão do seno e do cosseno da
soma de dois ângulos (ou argumentos).
•C •V •A •Ṕ •T •Ṕ. 145 •Ú •S
Observe que a expressão AB cos(α) pode ser interpretada como a projeção ortogonal
de um segmento de comprimento AB em uma direção que define um ângulo α com a
direção da reta AB. Por outro lado, dados dois vetores ~a e ~c de um espaço vetorial sobre
o corpo dos reais e munido de uma norma (onde se está adotando implicitamente a da
geometria euclidiana), podemos definir o produto escalar ~a·~c como sendo o escalar (i.e.,
o real):
~a · ~c ≡ |~a | |~c | cos(α) ,
sendo α o ângulo definido pelas direções dos vetores ~a e ~c. O produto escalar possui
aplicações importantes, com efeito, dados dois vetores ~a e ~b:
. determina a projeção ortogonal do vetor ~a na direção do vetor ~b , ~0 como sendo o
escalar
~a · ~b
proj~ ~a ≡
;
b
|~b|
. determina o componente ortogonal do vetor ~a sobre o vetor ~b , ~0 como sendo o vetor
comp~ ~a ≡
b
~a · ~b ~
b;
|~b|2
•C •V •A •Ṕ •T •Ṕ. 146 •Ú •S
. determina o cosseno14 do ângulo entre dois vetores não-nulos:
cos(θ) =
~a · ~b
.
|~a | |~b|
(Além disso, para espaços vetoriais abstratos, para os quais não cabe o uso de transferidor, é por meio de um produto escalar que se define o ângulo entre dois vetores.)
Se ı̂, ̂ e k̂ são os versores associados aos eixos ortogonais Ox, Oy e Oz, então (da
definição de produto escalar):
ı̂ · ı̂ = 1
̂ · ı̂ = 0
k̂ · ı̂ = 0
ı̂ · ̂ = 0
̂ · ̂ = 1
k̂ · ̂ = 0
ı̂ · k̂ = 0
̂ · k̂ = 0
k̂ · k̂ = 1
Dessa forma, se ~r = xı̂+ y ̂+zk̂ é o vetor posição de um ponto no espaço físico,
~r · ı̂ = x
~r · ̂ = y
⇔ ~r = ~r · ı̂ ı̂ + ~r · ̂ ̂ + ~r · k̂ k̂ .
~r · k̂ = z
Bem, seja um sistema ortogonal de coordenadas xyz e um ponto no plano xOy e,
seja ainda, outro sistema cartesiano x0 y0 z0 , girado de um ângulo α em torno do eixo Oz,
14
E, pela função arco cosseno (pág. 161), o ângulo θ.
•C •V •A •Ṕ •T •Ṕ. 147 •Ú •S
dessa forma, Oz ≡ Oz0 . Se ı̂0 , ̂0 e k̂ são os versores associados aos eixos x0 y0 z0 , então
podemos escrever:
0
~r = xı̂ + y ̂ + z k̂ = x0 ı̂0 + y0 ̂0 + z0 k̂
x = ~r · ı̂
x0 = ~r · ı̂0
0
onde
e
y = ~r · ̂
y = ~r · ̂0
0
z = ~r · k̂
z = ~r · k̂0
0
e, da definição de produto escalar: (ver Fig. 2.4)
ı̂ · ı̂0
ı̂ · ̂0
0
ı̂ · k̂
̂ · ı̂0
̂ · ̂0
0
̂ · k̂
k̂ · ı̂0
k̂ · ̂0
0
k̂ · k̂
= cos(α)
= cos( π2 + α) = − sen(α)
= cos( π2 ) = 0
= cos( π2 − α) = sen(α)
= cos(α)
= cos( π2 ) = 0
= cos( π2 ) = 0
= cos( π2 ) = 0
= cos(0) = 1 .
0
Dessa forma, z = z0 e k̂ = k̂ (em particular, se estivermos restritos ao plano xOy, então
•C •V •A •Ṕ •T •Ṕ. 148 •Ú •S
y
y0
6
OC
C
C
C
C
C
P
:0
CC
x
C
C α
x
O
Figura 2.4: Ilustração para a transformação de coordenadas cartesianas numa rotação
de eixos, α denota o ângulo entre os eixos Ox e Ox0 .
•C •V •A •Ṕ •T •Ṕ. 149 •Ú •S
z = z0 = 0) e
x0 = ~r · ı̂0 = xı̂ + y ̂ · ı̂0 = x ı̂ · ı̂0 + y ̂ · ı̂0 =
= x cos(α) + y sen(α)
0
y = ~r · ̂0 = xı̂ + y ̂ · ̂0 = x ı̂ · ̂0 + y ̂ · ̂0 =
= −x sen(α) + y cos(α)
0
z =z.
Essas relações podem ser reescritas em forma matricial:
0
x cos(α) sen(α) 0 x
y0 = − sen(α) cos(α) 0 y .
0
0
1 z
z0
Se, além disso, considerarmos outra rotação de eixos, de um ângulo β em torno de
Oz0 , passando do sistema x0 y0 z0 para o sistema x00 y00 z00 , então poderemos escrever
analogamente:
00
0
x00 cos(β) sen(β) 0 x0
y = − sen(β) cos(β) 0 y ,
z00
0
0
1 z0
portanto, usando a associatividade da multiplicação de matrizes,
00
x cos β sen β 0 cos α sen α 0 x
y00 = − sen β cos β 0 − sen α cos α 0 y .
0
0
1 z
0
0
1
z00
•C •V •A •Ṕ •T •Ṕ. 150 •Ú •S
Realizando a multiplicação das matrizes quadradas:
00
cos β sen α+sen β cos α 0 x
x cos β cos α−sen β sen α
y00 = − sen β cos α−cos β sen α − sen β sen α+cos β cos α 0 y
z00
0
0
1 z
Como a passagem do sistema xyz diretamente para o sistema x00 y00 z00 é realizado por
meio de uma rotação de um ângulo γ = α+β, podemos escrever:
00
x cos(α+β) sen(α+β) 0 x
y00 − sen(α+β) cos(α+β) 0 y
.
=
00
0
0
1 z
z
Finalmente, da igualdade entre matrizes, tira-se:
cos(α + β) = cos(α) cos(β) − sen(α) sen(β)
sen(α + β) = sen(α) cos(β) + cos(α) sen(β)
,
(2.14)
expressões que fornecem o seno da soma e o cosseno da soma em função do seno e
do cosseno das parcelas que compõem os seus argumentos. (Em §2.14.2, pág. 215,
apresentamos uma demonstração alternativa usando números complexos.)
2.6.
Algumas relações trigonométricas
Veremos outras relações trigonométricas de ampla utilização.
•C •V •A •Ṕ •T •Ṕ. 151 •Ú •S
2.6.1.
Tangente da soma dos argumentos
Das relações em (2.14), podemos tirar uma relação equivalente envolvendo a tangente,
com efeito:
sen(α + β) cos(α) sen(β) + sen(α) cos(β)
=
cos(α + β) cos(α) cos(β) − sen(α) sen(β)
tan(α) + tan(β)
tan(α + β) =
.
1 − tan(α) tan(β)
tan(α + β) =
2.6.2.
(2.15)
Redução ao primeiro quadrante
Diretamente das definições para as funções trigonométricas (§2.4), podemos escrever:
sen( π2 − α) = cos(α)
sen(0) = 0
sen( π2 ) = 1
cos( π2 − α) = sen(α)
cos(0) = 1
cos( π2 ) = 0
tan( π2 − α) =
1
tan(α)
tan(0) = 0
lim tan(α) = ∞
π
α→ 2
•C •V •A •Ṕ •T •Ṕ. 152 •Ú •S
e, novamente das relações (2.14):
cos( π2 + α) = − sen(α)
sen( π2 + α) = cos(α)
cos(2 α) = cos2 (α) − sen2 (α)
= 2 cos2 (α) − 1
sen(2 α) = 2 cos(α) sen(α)
π
cos( 2 + (−α)) = cos( π2 ) cos(−α) − sen( π2 ) sen(−α)
= 0 − 1 sen(−α)
e, da relação cos( π2 −α) = sen(α), obtida das definições,
sen(−α) = − sen(α) .
Por outro lado, sen( π2 −α) = cos(α) e
sen( π2 + (−α)) = cos( π2 ) sen(−α) + sen( π2 ) cos(−α)
= 1 cos(−α)
logo,
cos(−α) = cos(α) .
•C •V •A •Ṕ •T •Ṕ. 153 •Ú •S
Portanto a função seno é uma função ímpar e a função cosseno é par. Em vista dessas
relações, podemos tirar: (para lembrar dessas relações, basta lembrar a paridade de cada função)
cos(α − β) = cos(α) cos(β) + sen(α) sen(β)
(2.16)
sen(α − β) = sen(α) cos(β) − cos(α) sen(β) .
Particularmente úteis para a interpretação de inúmeras situações são as relações que
permitem transformar a soma cos(α)+sen(β) no produto de funções cosseno. Para obter
tal relação, podemos lançar mão das relações (2.14) e (2.16):
cos(a + b) = cos(a) cos(b) − sen(a) sen(b)
cos(a − b) = cos(a) cos(b) + sen(a) sen(b) .
Portanto:
cos(a + b) + cos(a − b) = 2 cos(a) cos(b) ,
fazendo a+b = α e a−b = β, tiramos a = 12 (α+β) e b = 12 (α−β), do que se segue a relação
procurada15 :
α+β
α−β
cos(α) + cos(β) = 2 cos(
) cos(
).
2
2
15 Propriedade que está, por exemplo, intimamente relacionada ao modo de descrever o fenômeno físico
conhecido por batimento.
•C •V •A •Ṕ •T •Ṕ. 154 •Ú •S
Das expressões para o seno e o cosseno da soma e para os argumentos 0 e π/2, podemos
tirar ainda:
cos(π) = −1
sen(π) = 0
cos(π + α) = − cos(α)
sen(π + α) = − sen(α) .
Outras relações úteis podem ser obtidas a partir dessas relações mais fundamentais,
tarefa que é deixada como problema para o estudante, particularmente a obtenção das
relações:
sen2 ( α2 ) = 21 1 − cos(α)
cos2 ( α2 ) = 21 1 + cos(α) .
•C •V •A •Ṕ •T •Ṕ. 155 •Ú •S
2.7.
Secante, cossecante, cotangente e
as funções trigonométricas inversas
Além das funções seno, cosseno e tangente, é útil considerar as funções:
secante:
cossecante:
cotangente:
1
;
cos(x)
1
csc(x) ≡
;
sen(x)
1
cot(x) ≡
.
tan(x)
sec(x) ≡
Algumas relações fundamentais são16 :
sec2 (x) − 1 = tan2 (x) ,
ou ainda:
(demonstre)
csc2 (x) − 1 = cot2 (x) .
Para tratarmos com as funções trigonométricas inversas precisamos determinar,
preliminarmente, o domínio e o contradomínio de cada uma das seis funções trigonométricas (ver pág. 37, rodapé 13). O gráfico das funções trigonométricas estão ilustradas
nas Fig. E.4 – Fig. E.8, pág. 362 – pág. 366 do Apêndice E. Pois bem:
16
Obtida diretamente de cos2 (x)+sen2 (x) = 1, dividindo-se membro a membro por sen2 (x).
•C •V •A •Ṕ •T •Ṕ. 156 •Ú •S
1. Para as funções y = sen(x) e y = cos(x) : o domínio é o corpo dos reais, e
o contradomínio, conforme pode ser verificado diretamente da definição, é o
intervalo fechado [−1, 1];
2. Para a função y = tan(x) : o domínio é R−{kπ+ π2 ; k ∈ Z}, e o contradomínio é
próprio corpo dos reais; embora essa função não esteja definida para x = kπ+ π2 ,
tem-se que:
lim tan(x) = +∞ e
lim tan(x) = −∞ ;
π
x→+ 2
π
x→− 2
3. Para a função y = cot(x) : o domínio é R−{kπ ; k ∈ Z}, e o contradomínio é próprio
corpo dos reais; embora essa função não esteja definida para x = kπ, tem-se que:
lim cot(x) = +∞ e
x→0
lim cot(x) = −∞ ;
x→π
4. Para a função y = sec(x) :
conjunto R−(−1, 1);
o domínio é R−{kπ+ π2 ; k ∈ Z}, o contradomínio é o
5. Para a função y = csc(x) :
conjunto R−(−1, 1).
o domínio é R − {kπ ; k ∈ Z}, o contradomínio é o
Podemos sintetizar as definições das funções trigonométricas em termos das coorde-
•C •V •A •Ṕ •T •Ṕ. 157 •Ú •S
nadas cartesianas (x, y) de um ponto no plano xOy (o leitor pode verificar)17 :
y
sen(θ) = p
2
x + y2
y
tan(θ) =
x
p
x2 + y2
csc(θ) =
y
cos(θ) = p
cot(θ) =
sec(θ) =
x
y
p
x
x2 + y2
(2.17)
x2 + y2
.
x
As relações anteriores envolvendo seno e cosseno são empregadas quando se utilizam
as coordenadas polares no plano.
Quanto à paridade, pode-se verificar facilmente que:
1. são funções ímpares: seno, tangente, cotangente e cossecante; enquanto,
2. são funções pares: cosseno, secante.
As funções trigonométricas (seno, cosseno, tangente, cossecante, secante e cotangente)
são periódicas. Como todas essas funções podem ser expressas em função de seno ou
cosseno, podemos analisar a paridade dessas duas funções; com efeito, como para
17 Não se deve confundir o argumento x, usado para funções trigonométricas, com a coordenada x, usada
para denotar as coordenadas cartesianas (x, y), como na definição de cada uma dessas funções em (2.17), o
contexto sempre distinguirá a interpretação.
•C •V •A •Ṕ •T •Ṕ. 158 •Ú •S
qualquer x ∈ R vale:
sen(x + a) = sen(x) cos(a) + cos(x) sen(a)
cos(x + a) = cos(x) cos(a) − sen(x) sen(a) .
Então, de sen(x+a) = sen(a), tira-se:
sen(x) cos(a) + cos(x) sen(a) = sen(x) , daí,
[1 − cos(a)] sen(x) = cos(x) sen(a) .
Para que essa igualdade seja satisfeita para qualquer que seja x real, devemos ter
sen(a) = 0 e 1−cos(a) = 0, ou seja, a = 2kπ, uma vez que sen(a) = 0 para a = kπ e cos(a) = 1
para a = 2kπ. Logo a função seno é periódica, e seu período é T = 2π. Deixamos como
exercício a demonstração que a função cosseno é periódica de período18 T = 2π. Para
18
Quando se trabalha com os números reais, os ângulos ou os argumentos das funções trigonométricas
devem sempre ser expressos em radianos. O radiano é unidade de medida de ângulo e é definido como
sendo a razão entre o raio de um círculo com centro no vértice do ângulo e o comprimento do arco de
círculo definido pelos lados do ângulo. Uma vez que o comprimento de arco de um círculo é diretamente
proporcional ao seu raio, essa razão é constante para círculos concêntricos e comprimentos de arco definidos
pelos dados de um mesmo ângulo. Quando a unidade de um ângulo não estiver explicitada, estará sempre
implícito o radiano como unidade. O sistema internacional de unidades (SI) considera o radiano como
“unidades SI suplementares: considerando que se exprime o ângulo plano como a razão entre dois comprimentos e o
ângulo sólido como a razão entre uma área e o quadrado de um comprimento e a fim de manter a coerência interna do
Sistema Internacional estabelecido com apenas sete (7) unidades de básicas, o CIPM (1980) determinou que, no Sistema
Internacional, as unidades suplementares radiano e esterradiano são unidades derivadas sem dimensão. Resulta daí que
•C •V •A •Ṕ •T •Ṕ. 159 •Ú •S
determinar o período da função tangente, temos que, para tan(x) = tan(x+a): [ver (2.15)]
tan(x) =
tan(x) + tan(a)
,
1 − tan(x) tan(a)
daí
tan(x) + tan(a) = tan(x) − tan2 (x) tan(a) ,
portanto, devemos ter para qualquer x ∈ R:
1 − tan2 (x) tan(a) = 0 ,
que será satisfeita (∀x ∈ R) apenas se tan(a) = 0, o que ocorre se a = kπ (conforme pode
ser verificado da própria definição), mostrando que o período de y = tan(x) é T = π.
Como uma função periódica não é injetiva, para considerarmos as funções trigonométricas inversas devemos considerar restrições no domínio dessas funções para que se
obtenha uma bijeção associada à respectiva função. Examinaremos caso a caso.
2.7.1.
Função arco seno
A função seno é ímpar e periódica de período 2π rad, portanto, o subconjunto do
domínio definido pelo intervalo (fechado) [− π2 , + π2 ] caracteriza muito bem todas as
as grandezas ângulo plano e ângulo sólido são consideradas como grandezas derivadas sem dimensão. Essas unidades
suplementares podem ser ou não utilizadas nas expressões das unidades derivadas, a fim de facilitar a distinção entre
grandezas de natureza diferente tendo a mesma dimensão (radiano por segundo, rad/s; radiano por segundo quadrado,
rad/s2 ).
•C •V •A •Ṕ •T •Ṕ. 160 •Ú •S
características de simetria da função. Dessa forma, uma boa restrição do domínio a
esse conjunto é a injeção tal que
h π πi
sen [− , + ] = [−1, +1] .
2
2
Assim, a função inversa da bijeção sen : [− π2 , + π2 ] → [−1, +1] é a função
y ≡ arcsen(x),
tal que
sen(y) = x,
chamada função arco seno. Alternativamente, essa função é denotada sob a forma19 :
arcsen(x) = sen−1 (x) .
2.7.2.
Função arco cosseno
Como a função cosseno é par e periódica de período 2π rad, o subconjunto do domínio
definido pelo intervalo (fechado) [0, π] caracteriza muito bem todas as características
de simetria da função. Dessa forma, uma boa restrição do domínio a esse conjunto seria
a injeção tal que
h
i
cos [0, π] = [−1, + 1] .
Portanto, a função inversa da bijeção cos : [0, π] → [−1, + 1] é a função
y ≡ arccos(x),
tal que
cos(y) = x,
19
Que não deve ser confundida como indicando o inverso multiplicativo do seno, i.e., não se deve confundir
o inverso (multiplicativo) da função [(sen(x))−1 ] com a função inversa [sen−1 (x)].
•C •V •A •Ṕ •T •Ṕ. 161 •Ú •S
chamada função arco cosseno. Alternativamente, essa função é denotada na forma:
arccos(x) = cos−1 (x) .
2.7.3.
Função arco tangente
Como a função tangente é ímpar e periódica de período π rad, o subconjunto do
domínio definido pelo intervalo (aberto20 ) (− π2 , + π2 ) caracteriza muito bem todas as características de simetria da função. Dessa forma, uma boa restrição do domínio a esse
conjunto é a injeção tal que
h π πi
tan (− , + ) = R .
2
2
Portanto, a função inversa da bijeção tan : (− π2 , + π2 ) → R é a função
y ≡ arctan(x),
tal que
tan(y) = x ,
chamada função arco tangente. Alternativamente, essa função é denotada na forma:
arctan(x) = tan−1 (x) .
As funções inversas das funções cotangente, secante e cossecante (respectivamente:
arco cotangente, arco secante e arco cossecante) podem ser definidas segundo os mesmos
moldes das funções inversas acima, deixamos para o leitor (como problema) a tarefa de
defini-las.
20
O intervalo deve ser aberto porque a tangente não está definida para x = ± π2 .
•C •V •A •Ṕ •T •Ṕ. 162 •Ú •S
2.8.
Derivadas das funções trigonométricas
É fácil observar, com base no §2.4, que a função sen(x) é crescente para 0 ≤ x ≤ π2 , onde
varia de 0 até 1. Da mesma forma, a função cos(x) é decrescente nesse mesmo intervalo,
onde varia de 1 até 0. Por outro lado, como sen2 (x)+cos2 (x) = 1 para qualquer x ∈ R,
então, derivando-se membro a membro, tira-se:
sen(x)
d
d
sen(x) + cos(x)
cos(x) = 0 ∀x ∈ R,
dx
dx
(2.18)
daí (como essa relação é válida qualquer que seja o real x), devemos ter
d
d
sen(x)
=
+
cos(x)
,
e
dx
dx sen(x) = − cos(x) , e
ou
d
d
cos(x) = − sen(x) ,
cos(x) = + sen(x) ,
dx
dx
onde o sinal deve ser ainda determinado. Bem, como (2.18) é válida para qualquer
x ∈ R, então será válida, em particular, no intervalo 0 ≤ x ≤ π2 , onde sen(x) é crescente e
cos(x) > 0, portanto
d
sen(x) = + cos(x) ∀x ∈ R
(2.19)
dx
e onde cos(x) é decrescente e sen(x) > 0, portanto
d
cos(x) = − sen(x) ∀x ∈ R.
dx
(2.20)
•C •V •A •Ṕ •T •Ṕ. 163 •Ú •S
Tem-se ainda:
cos(x) − sen2 (x)
d
tan(x) =
−
= 1 + tan2 (x)
dx
cos(x)
cos2 (x)
ou seja,
d
tan(x) = sec2 (x)
(2.21)
dx
A determinação da derivada das funções: cotangente, secante e cossecante é deixada
como problema.
Para as funções inversas, temos21 :
21
Se y = f (x) é uma bijeção e x = g(y), tal que g( f (x)) = x, é a sua função inversa,
dg
g(y + ∆y) − g(y)
= lim
dy ∆y→0
∆y
[ como g(y + ∆y) − g(y) = ∆g(y) = ∆x ]
∆x
f (x + ∆x) − f (x)
#−1
"
f (x + ∆x) − f (x)
= lim
∆x
∆x→0
#−1
"
df .
=
dx x=g(y)
= lim
∆y→0
que expressa a derivada da função inversa g em termos da função f .
•C •V •A •Ṕ •T •Ṕ. 164 •Ú •S
1. para y = arcsen(x) ⇔ x = sen(y), como
" #−1
h
i−1
dx
d
= cos(y)
arcsen(x) =
dx
dy
r
−1
2
= 1 − sen(y) ,
então
1
d
arcsen(x) = √
,
dx
1 − x2
2. por procedimento análogo, podemos tirar:
d
−1
arccos(x) = √
,
dx
1 − x2
3. para y = arctan(x) ⇔ x = tan(y), como
" #−1
h
i−1
d
dx
arctan(x) =
= 1 + tan2 (y)
dx
dy
h
i−1
= 1 + x2
,
•C •V •A •Ṕ •T •Ṕ. 165 •Ú •S
então
d
1
arctan(x) =
.
dx
1 + x2
A determinação da derivada das funções: arco cotangente, arco secante e arco cossecante é deixada como problema.
Particularmente importante para a física são as seguintes relações (que podem ser
verificadas facilmente):
2
d
cos(x) = − cos(x)
dx2
.
d2
sen(x) = − sen(x)
dx2
Considero muito ilustrativo o procedimento anterior para a derivada das funções seno e
cosseno, porém há um pequeno problema que pode ter ficado despercebido mesmo para
leitor atento. Observe-se que as expressões obtidas da derivação da relação cos2 (x)+
sen2 (x) = 1 ficam determinadas a menos de um fator constante não-nulo, i.e., esse
procedimento leva-nos a concluir que
d
sen(x) = +a cos(x)
dx
e
d
cos(x) = −a sen(x) ,
dx
de tal maneira que a é uma constante positiva a ser determinada. Não estou conseguido
determiná-la por meio das relações entre as funções trigonométricas (obtendo sempre
•C •V •A •Ṕ •T •Ṕ. 166 •Ú •S
relações que são satisfeitas identicamente qualquer que seja a constante a > 0). Para
uma demonstração mais rigorosa (que deixe essa constante a bem determinada) é
melhor utilizarmos a própria definição de derivada. Estava tentando evitar o uso desse
expediente porque precisaremos estudar o comportamento das funções y = sen(x) e
y = cos(x) numa vizinhança de x = 0 (convido o leitor a fazer essa demonstração antes
de prosseguir a leitura). Com efeito,
sen(x + ∆x) − sen(x)
d
sen(x) = lim
∆x→0
dx
∆x
= lim
∆x→0
sen(x) cos(∆x) + sen(∆x) cos(x) − sen(x)
.
∆x
Para ∆x pequeno, i.e., para ∆x ≈ 0, qual o comportamento de cos(x) e de sen(x)? Vejamos.
[ considere dois círculos
Considere o triângulo OAB, retângulo em A; seja θ o ângulo BOC,
com centro em O, um com raio OA e outro de raio OB, seja ainda A0 B0 paralelo a AB,
tal que A0 é a interseção da reta suporte de OA e o círculo de raio OB, dessa forma,
OA0 = OB e, para θ ∈ (0, π2 ):
•C •V •A •Ṕ •T •Ṕ. 167 •Ú •S
OA
=
cos(θ) =
OB
AB
sen(θ) =
=
OB
AB
=
tan(θ) =
OA
OA0
OB0
AB0
OB0
AB0
OA0
Se o leitor esboçar a figura descrita, poderá ver que, conforme θ diminui, AB e A0 B0
começam a se confundir com o comprimento de arco de círculo (com centro em O) que
liga A0 a B. Isso indica que, para θ ≈ 0, devemos ter:
AB ≈ A0 B0 ≈ arco (A0 B)
OB ≈ OB0
OA ≈ OA0
OB ≈ OA0 ≈ OA .
Portanto, para θ ≈ 0, podemos dizer que:
cos(θ) ≈ 1
e
sen(θ) ≈ tan(θ) ≈ θ ,
com θ expresso em radiano. Finalmente, voltando à expressão do limite, podemos
•C •V •A •Ṕ •T •Ṕ. 168 •Ú •S
escrever:
sen(x)1 + ∆x cos(x) − sen(x)
d
sen(x) = lim
∆x→0
dx
∆x
∆x cos(x)
= lim
∆x→0
∆x
= lim cos(x)
∆x→0
= cos(x) .
O que mostra claramente que a = 1. Deixamos como exercício a demonstração da
derivada de y = cos(x), através da definição de derivada.
No §2.14.3, pág. 216, apresentamos uma demonstração alternativa com base nas funções complexas e da fórmula de Euler, sendo muito mais simples do que a apresentada
anteriormente.
2.9.
Lei do cosseno e lei dos senos
Além da sua aplicabilidade específica em a geometria (envolvendo medidas em triângulos), temas como lei dos senos e lei do cosseno são muitas vezes utilizados de forma
indireta quando se emprega o cálculo vetorial. O produto escalar implica diretamente
a lei do cosseno, e o produto vetorial implica a lei dos senos. Vejamos. Com referência
•C •V •A •Ṕ •T •Ṕ. 169 •Ú •S
à Fig. 2.5, usaremos a seguinte notação:
a = BC , b = AC , c = AB , b0 = CA0 , h = A0 B ;
d b d b d b
BAC = A , CBA = B , ACB = C (ângulos);
−→
~ −→ ~ −−→
a = CB , b = CA e ~c = AB .
C
B
A
A0
Figura 2.5: Ilustração para a lei do cosseno e para a lei dos senos.
2.9.1.
Lei do cosseno (argumento geométrico)
Dado um triângulo qualquer ABC (como mostra a Fig. 2.5), podemos prolongar o lado
CA e tirar uma perpendicular que passa por B, obtendo, assim, o triângulo retângulo
•C •V •A •Ṕ •T •Ṕ. 170 •Ú •S
A0 BC. Aplicando o teorema de Pitágoras (ver §2.2, pág. 134) ao triângulo retângulo A0 BC:
a2 = b02 + h2 .
Como b0 = b+c cos(π−b
A) = b−c cos(b
A) e h = c sen(b
A), então
h
i
a2 = b2 + c2 cos2 (b
A) − 2bc cos(b
A) + c2 sen2 (b
A)
= b2 + c2 − 2bc cos(b
A) .
O ângulo entre os vetores ~b e ~c é α = π−b
A, dessa forma, a lei do cosseno pode ser expressa
como:
a2 = b2 + c2 − 2bc cos(b
A) = b2 + c2 + 2bc cos(α) .
2.9.2.
Lei do cosseno (argumento algébrico)
Se considerarmos o vetor ~a =~b+~c, então multiplicando escalarmente membro a membro,
obtemos:
~a · ~a = ~b · ~b + ~c · ~c + 2~b · ~c ,
ou seja,
|~a |2 = |~b|2 + |~c |2 + 2|~b| |~c | cos(α) .
Que é justamente a lei do cosseno escrita na forma vetorial. Talvez esteja evidente como
o tratamento algébrico é poderoso e sistemático, podendo ser executado dispensando-se
qualquer figura ilustrativa.
•C •V •A •Ṕ •T •Ṕ. 171 •Ú •S
2.9.3.
Lei dos senos (argumento geométrico)
Antes de abordar geometricamente a lei dos senos, vamos demonstrar a expressão
para a área de um triângulo: “metade do comprimento da base multiplicado pela
altura (em relação a esse lado)”. Para o caso de um triângulo retângulo é trivial, uma
vez que a diagonal de um retângulo é a hipotenusa de dois triângulos retângulos
das mesmas dimensões e de área igual à metade da área do retângulo. Para a área
de um triângulo qualquer ABC, como o da Fig. 2.5, podemos sempre considerar dois
triângulos, o “nosso” ABC e o triângulo retângulo AA0 B, tal que o cateto AA0 é um
prolongamento do lado CA e o cateto A0 B é a altura de ABC em relação ao lado CA.
Denotando por A0 a área do triângulo ABC, por A1 a do CA0 B, e por A2 a do AA0 B,
tiramos da Fig. 2.5 que
A0 = A1 − A2
Como
e mais: como
A1 =
A2 =
1
2
1
2
CA0 · A0 B
AA0 · A0 B ,
A0 B = a sen(b
C) = h
0
b
CA
=
a
cos(
C)
A0 A = a cos(b
C) − b ,
•C •V •A •Ṕ •T •Ṕ. 172 •Ú •S
então:
A0 =
a cos(b
C)h −
=
1
2
1
2
=
1
2
ab sen(b
C) ,
1
2
a cos(b
C) − b h
bh
que exprime a área do triângulo em termos do lado b e da altura (h = a sen(b
C)) relativa a
esse lado. Aplicando essa expressão a cada um dos lados (e usando a altura relativa a
esse lado), podemos escrever:
1
2
a b sen( b
c) =
1
2
b c sen( b
a) =
1
2
c a sen( b
b).
Estamos considerando que o triângulo existe, portanto (o produto) abc , 0, daí, dividindo a expressão anterior por 12 abc, tiramos finalmente a lei dos senos ou o teorema de
Lamy (como também esse resultado é conhecido):
sen(b
C) sen(b
B) sen(b
A)
=
=
.
c
b
a
Prova geométrica alternativa Como mais um exemplo de aplicação do teorema do
ângulo inscrito (Teo. 2.2.2) e do conceito de arco capaz, apresentamos uma demonstração alternativa para a lei dos senos. Seja um triângulo ABC e seu círculo inscrito22 de
22
O centro do círculo circunscrito a um triângulo é determinado pela intersecção das mediatrizes dos
lados; bastam dois lados.
•C •V •A •Ṕ •T •Ṕ. 173 •Ú •S
centro O e raio R. A situação de triângulos para os quais o centro do círculo circunscrito lhe é exterior está ilustrado na Fig. 2.6, a prova para os outros casos ficará como
exercício. Traçando a diagonal AM obtém-se o arco capaz do ângulo b
B para o lado AC,
Figura 2.6: Triângulo ABC e seu círculo circunscrito com centro em O e raio R.
•C •V •A •Ṕ •T •Ṕ. 174 •Ú •S
[ e pelo teoremas de Thales ACM
[ = 90◦ , daí b = 2R sen b
portanto b
B = AMC
B; analogamente
b
para o triângulo AMB se tira: c = 2R sen C; finalmente, tirando os raios CO e BO, tem[ = 360◦ − 2A
b ≤ 180◦ , portanto tirando a altura do triângulo isósceles COB,
se que COB
[ = 180◦ − A,
b daí
obtém-se o triângulo retângulo COP tal que CP = a/2, b
P = 90◦ e COP
b portanto a = 2R sen(A),
b então
a/2 = R sen(180◦ − A),
sen(b
C) sen(b
B) sen(b
A)
1
=
=
=
,
c
b
a
2R
note-se que esta prova permite afirmar que a razão entre o seno do ângulo de um vértice
e o lado oposto é igual ao inverso do diâmetro do circulo circunscrito ao triângulo.
2.9.4.
Lei dos senos (argumento algébrico)
−→
−−→
−→
Consideremos os segmentos ~a = BC, ~b = CA e ~c = AB associados ao triângulo ABC,
portanto, ~a = ~b+~c e, então, usando do produto vetorial e a notação (~
u, ~
v ) para o ângulo
~ e~
entre os vetores u
v levados a origem comum, tem-se:
~a × ~b = ~b × ~b + ~c × ~b
| ~a | | ~b | sen(~a, ~b ) = 0 + | ~c | | ~b | sen(~c, ~b )
= | ~c | | ~b | sen(~c, ~b ) ,
•C •V •A •Ṕ •T •Ṕ. 175 •Ú •S
por outro lado, (note-se que sen(~c, ~b ) ≥ 0)
~a × ~c = ~b × ~c + ~c × ~c
| ~a | | ~c | sen(~a, ~c) = | ~b | | ~c | sen(~b, ~c)+; 0
= | ~b | | ~c | sen(~b, ~c) .
Portanto
| ~a | | ~b | sen(~a, ~b ) = | ~b | | ~c | sen(~b, ~c ) = | ~a | | ~c | sen(~a, ~c ) .
Se os vetores ~b e ~c não são paralelos, podemos exprimir a lei dos senos:
sen(~b, ~c ) sen(~a, ~c ) sen(~a, ~c )
=
,
=
| ~a |
| ~c |
| ~b |
ou ainda, como (~b, ~c )+b
a = π rad, etc., tem-se:
sen(b
A) sen(b
B) sen(b
C)
=
=
.
~
~
| ~a |
|
c
|
|b|
~1 , u
~2 e u
~3 , tais que
Problema 2.1. Aplique o teorema dos senos aos vetores u
~1 +~
u
u2 +~
u3 = ~0 .
(Alguns autores reservam o termo teorema de Lamy quando a lei dos senos é aplicada a
situações envolvendo três vetores cuja soma seja o vetor nulo.)
•C •V •A •Ṕ •T •Ṕ. 176 •Ú •S
2.10.
Função exponencial e função logaritmo
Nosso objetivo mais imediato neste parágrafo é retomar a notação exponencial para
grupos, conforme definida no §1.3.4.5 (pág. 64), onde os expoentes foram considerados
como inteiros, e generalizá-la para expoentes racionais e, em seguida, para expoentes
reais; isso com a intenção de aplicá-la diretamente ao grupo multiplicativo do corpo
dos reais. É claro que a notação do §1.3.4.5 pode ser empregada integralmente e sem
qualquer modificação para o grupo multiplicativo (R−{0}, · ), embora a generalização
pretendida para os reais não seja uma tarefa tão trivial quanto se espera inicialmente
(conforme ficará constatado no §2.10.3).
Para a notação an , chamamos: a de base e n de expoente.
2.10.1.
Expoentes racionais
√
Dado o real a e o natural n, usa-se a notação n a (lê-se: raiz
n-ésima de a) para indicar a
√
n
relação, com domínio
R×N
e
amplitude
R,
que
associa
a
a
(possivelmente23 ) o real b
√
n
n
n
tal que b = ( a) = a. Além dessas definições, dado o racional não-nulo r (isto é, dado
r = p/q tal que p, q ∈ N) e o real não-nulo a, denotamos por
ap/q
√
2
o real tal que
(ap/q )q ≡ ap .
23
Observe que não se trata de função, uma vez que a imagem pode não estar definida em R, por exemplo:
−1 = i < R.
•C •V •A •Ṕ •T •Ṕ. 177 •Ú •S
√
Dessa forma, para n ∈ N, podemos escrever a1/n = n a. Usa-se denotar ainda:
√q
ap/q ≡ ap .
Todas as propriedades levantadas em §1.3.4.5 permanecem válidas, em particular:
(ar1 )r2 = ar1 · r2
∀r1 , r2 ∈ Z.
Dados o real positivo a e o racional r, podemos√considerar ar como resultado da
operação chamada potenciação; da mesma forma, n a pode ser encarada como uma
operação entre a e o natural n, a operação de radiciação.
Quando consideramos os expoentes naturais, dado qualquer real a, definimos a
função
an : N → R tal que n 7→ an ;
alternativamente, poderíamos estar considerando a função
an : R×N → R , onde a ∈ R e n ∈ N .
Nossa tarefa aqui está sendo estender o domínio dessa função. Quando consideramos expoentes
inteiros,
devemos excluir o caso a = 0, isto é, devemos considerar a
n
o
n
função a : R−{0} ×Z → R. As considerações já ficam um pouco mais sutis quando
se estende para os expoentes racionais, uma vez que, se a < 0 e n ∈ N, então a1/(2n) < R
(Teorema 1.4.8, pág. 85). Para estender essa função para expoentes racionais, fixada a
base real, precisamos considerar em separado os casos de base positiva e base negativa.
•C •V •A •Ṕ •T •Ṕ. 178 •Ú •S
2.10.2.
Função logaritmo e função exponencial
sobre os racionais
Existem várias maneiras de estender a função exponencial dos racionais para os reais.
De qualquer forma, essa extensão caracteriza uma ruptura com o que se costuma chamar
de álgebra elementar (i.e., a álgebra que envolve apenas funções algébricas; ver §2.10.4).
Mas, tendo a lembrança de uma pergunta não rara sobre o significado, a importância e a
origem do número real e, resolvemos mudar um pouco a linha de abordagem, seguindo
os moldes de [18, Cap. IX, §7], definindo a função logaritmo [neperiano] (y = ln(x)) e,
a partir dela, a função exponencial (y = ex ). Antes, porém, definiremos logaritmo, ainda
em termos de uma exponencial com argumento racional. Para tal objetivo, precisamos
demonstrar que a função exponencial é injetiva; com efeito, se ab = ab+c , então
1 = a−b ab+c
⇒
1 = a(b+c)−b
⇒
1 = ac ,
logo, se a ∈ R+ −{1}, c = 0. Isto é, a função exponencial é injetiva.
Seja a ∈ R+ −{1} e r ∈ Q/; se x > 0, então loga x = r (lê-se: logaritmo de x na base a é igual
a r) significa (por definição)
x = ar
⇔
loga x ≡ r ,
(2.22)
portanto, se A é a imagem da função ar : Q → R+ , a > 0 e a , 1, então a função
loga x : A → Q é a função inversa da função ar : Q → A.
•C •V •A •Ṕ •T •Ṕ. 179 •Ú •S
As identidades
x+y
a
= ax · a y
x y
(a ) = ax y
0
a =1
(2.23)
(que sintetizam as propriedades fundamentais das funções exponenciais) permitem
demonstrar as seguintes propriedades para as funções loga x : A → Q:
loga (xy) = loga x + loga y
loga (xq ) = q loga x ;
q∈Q
(2.24)
log 1 = 0 .
a
Essas propriedades podem ser facilmente demonstradas a partir da definição (2.22) e
das propriedades (2.23). (Demonstre!, após veja o seguinte rodapé.)24
É oportuno observar que25 a função ar e a sua função inversa loga (x) estabelecem
um isomorfismo entre os grupos (Q, +) e (Q−{0}, · ). Esse isomorfismo é utilizado, por
24
Seja
x = ar ⇔ loga (x) = r
y = as ⇔ log (y) = s
a
,
então
x y = ar+s ⇒ loga (x y) = r + s ⇒ loga (x y) = loga (x) + loga (y) .
x = ar ⇒ xq = (ar )q = aqr ⇒ loga (xq ) = qr ⇒ loga (xq ) = q loga (x) .
25
Estamos considerando as devidas restrições para que essas funções sejam bijeções.
•C •V •A •Ṕ •T •Ṕ. 180 •Ú •S
exemplo, pelas velhas réguas de cálculo26 , tão úteis antes do advento das calculadoras
eletrônicas e dos computadores.
Também são relevantes as seguintes propriedades:
log x
a a =x
loga x
logb x = log b
a
∀a ∈ R+ −{1} e ∀x ∈ R+
(2.25)
∀a, b ∈ R+ −{1} e ∀x ∈ R+ .
Se aloga x = A, então loga A = loga x,
loga A−loga x = 0 ,
loga A+loga x−1 = 0 ,
loga (Ax−1 ) = 0 ,
Ax−1 = 1 ,
daí, se a ∈ R+ −{1}, A = x. Para demonstrar a segunda igualdade (que se presta para
realizar uma mudança de base de logaritmo), seja
u
loga x = u ⇒ a = x
⇒ au = bv ⇒ loga au = loga bv , daí
v
logb x = v ⇒ b = x
u loga a = v loga b ⇒ u · 1 = logb x · loga b ⇒ loga x = logb x · loga b .
26
Que fazendo uso de escalas logarítmicas, dentre outras operações, permitem multiplicar por meio da
adição de logaritmos; infelizmente não se prestam para efetuar somas, mas multiplicam e dividem muito
bem.
•C •V •A •Ṕ •T •Ṕ. 181 •Ú •S
2.10.2.1. Problema
Se a e b são reais positivos diferentes de 1, demonstre que27
bx = ax loga b .
Bem, e as funções exponenciais e logarítmicas definidas sobre os reais?...
2.10.3.
Função logaritmo e função exponencial sobre os reais
Neste parágrafo, consideraremos que o leitor conheça conceitos rudimentares de limite, de derivada e de integral (de Riemann), algumas propriedades utilizadas estão
demonstradas em pé de página ou podem ser encontradas por meio do índice.
A função real λ : R+ → R+ tal que λ(t) 7→ 1/t está bem definida pela própria estrutura
de corpo, afinal associa a cada real positivo o seu simétrico multiplicativo. O gráfico
da função y = λ(t) = 1/t é o ramo de uma hipérbole que está no primeiro quadrante no
plano tOy (ver Fig. E.1, pág. 359). Usando essa função y = λ(t), definiremos a função
ln : R+ → R tal que
Z x
1
ln(x) ≡
dt .
(2.26)
t
1
Dado x do domínio R+ , o elemento ln(x) do contradomínio R é chamado logaritmo
natural, logaritmo neperiano ou, simplesmente, logaritmo de x. Da definição anterior,
27
x
Com efeito, bx = aloga b = ax loga (b) .
•C •V •A •Ṕ •T •Ṕ. 182 •Ú •S
tira-se que ln(1) = 0, uma vez que
Z
1
1
Além disso:
1
dt = 0 .
t
ln(x) > 0 para x > 1 ;
ln(x) = 0 para x = 1 ;
ln(x) < 0 para 0 < x < 1 ,
e mais: como x > 0 e da definição (2.26):
1
d
ln(x) =
> 0,
dx
x
portanto a função é (monótona) crescente. Como toda função monótona28 é uma injeção
e como
lim ln(x) = −∞ e
lim ln(x) = +∞ ,
x→+∞
x→0
tem-se que o conjunto imagem ln[R] é o conjunto dos reais. Portanto, ln : R+ → R é uma
bijeção, e a sua função inversa é denotada por exp : R → R+ , a qual chamamos função
exponencial (de base natural29 ), tal que
y = exp(x)
28
29
⇔
x = ln(y)
∀x ∈ R.
(2.27)
Isto é, uma função estritamente crescente ou estritamente decrescente.
O termo ‘natural’ não está significando um elemento do conjunto dos números naturais.
•C •V •A •Ṕ •T •Ṕ. 183 •Ú •S
Como ln(1) = 0, é imediato que exp(0) = 1. O real exp(1) é normalmente denotado por e,
ou seja,
e ≡ exp(1) ,
(2.28)
portanto ln(e) = 1. O símbolo30 e é chamado base dos logaritmos naturais (ou neperianos).
Duas propriedades fundamentais envolvendo essas duas funções são31 :
exp (ln(x)) = x ∀x ∈ R+
(2.29)
ln (exp(z)) = z ∀z ∈ R+ .
Em face das notações do §2.10.2 e da definição de e [equação (2.28)], podemos utilizar
indiscriminadamente as seguintes notações:
ln(x) = loge x
exp(x) = ex .
e
Enunciaremos uma propriedade fundamental por meio da proposição:
Teorema 2.10.1. Sejam x, z ∈ R+ , então:
ln(xz) = ln(x) + ln(z) .
30
31
(2.30)
Re
Lembra-se que e é tal que 1 u1 du = 1.
Com efeito, como as funções logaritmo e exponencial são injetivas,
u = ln(exp(z)) ⇔ exp(u) = exp(z)
v = exp(ln(x)) ⇔ ln(v) = ln(x)
⇔
⇔
u=z
v=x
⇔
⇔
ln(exp(z)) = z ;
exp(ln(x)) = x .
•C •V •A •Ṕ •T •Ṕ. 184 •Ú •S
Prova. De (2.26),
Z
xz
1
dt
t
Z1 x
Z xz
1
1
dt +
dt
=
t
1 t
Z xz x
1
= ln(x) +
dt .
t
x
ln(xz) =
Precisamos determinar a integral do segundo membro, com efeito, realizando a transformação de coordenadas t = b α, então dt = b dα e
Z xz
Z xz
Z xz
b
b
b
1
1
dt =
dα =
dα
x
x
t
b
α
α
x
b
b
e, finalmente, tomando (para cada x ∈ R+ ) b = x, tem-se:
Z z
Z xz
1
1
dt =
dα = ln(z) .
t
α
x
1
Será possível definir uma função exponencial ou uma função logaritmo sobre os
reais com “bases” diferentes da base e? Como o fazer? Vejamos32 . Essas funções (reais
32
Considero esse ensaio muito instrutivo porque mostra uma forma de como se obter uma generalização,
algo muito interessante em física teórica.
•C •V •A •Ṕ •T •Ṕ. 185 •Ú •S
e em termos da base e), quando aplicadas sobre argumentos racionais, devem coincidir
com os valores das correspondentes funções racionais (§2.10.2) e devem possuir as
mesmas propriedades algébricas, portanto, espera-se que seja válida a relação (2.25),
em particular
loga (x)
logb (x) =
,
loga (b)
se b = e, então
Z
loga (x) = loga (e)
1
x
1
dt ,
t
daí, para x = a, esperamos que
Z
1 = loga (e)
1
a
1
dt
t
⇔
loga (e) = Z
1
a
1
.
1
dt
t
Portanto, podemos adotar como33 definição geral para a função logaritmo na base a ∈ R−{1}:
∀a ∈ R+ −{1} e ∀x > 0
Z x
1
1
loga (x) ≡ Z a
dt .
(2.31)
t
1
1
dt
1 t
33
Poderíamos ter feito esse ensaio num rascunho e usado essa expressão como uma definição geral.
•C •V •A •Ṕ •T •Ṕ. 186 •Ú •S
Se ainda não tivéssemos definido o real e, neste ponto poderíamos o ter definido como
sendo e tal que
Z e
1
dt ≡ 1 .
1 t
Essa propriedade já seria importante o suficiente para caracterizar o real e, mas, particularmente para a física, veremos adiante [equação (2.35), pág. 188] que a derivada da
exponencial também possui importância fundamental para vários sistemas físicos.
Da definição geral (2.31), podemos adotar como definição geral para a função exponencial numa base a ∈ R−{1}:
y = loga (x)
⇔
x = ay
∀x ∈ R.
(2.32)
As propriedades (2.25) permanecem válidas no caso geral, conforme pode ser facilmente
verificado.
Antes de determinarmos a derivada da função exponencial na base a, determinaremos a da função logaritmo na base a. Da definição (2.31), tira-se diretamente a derivada
da função logaritmo:
1
1
1
d
1
loga (x) = R a
=
·
,
·
1
dx
ln(a) x
dt x
1 t
portanto
d
1
1
loga (x) =
·
.
dx
ln(a) x
(2.33)
•C •V •A •Ṕ •T •Ṕ. 187 •Ú •S
Logo:
se 0 < a < 1 ,
se a > 1 ,
y = loga (x) é uma função decrescente,
y = loga (x) é uma função crescente.
Além disso, como a derivada da função inversa é o inverso da derivada34 , como
y = ax ⇔ x = loga (y) ,
e como
d
1
1
1
1
dx
=
lna (y) =
·
=
· ,
dy dy
ln(a) y
ln(a) ax
então: a derivada da função exponencial na base a é
d x
a = ln(a) · ax .
dx
(2.34)
Aqui está uma das principais características da função exponencial, que a torna tão
importante para tantos sistemas que ocorrem na natureza, vejamos com mais cuidado.
Seja uma constante λ ∈ R qualquer, então, pela regra da cadeia35 ,
d λx
a = λ ln(a) aλx .
dx
34
35
(2.35)
Ver demonstração no rodapé 21, pág. 164.
Sejam y = f (x) e z = g(y) duas funções que admitem a função composta z = g( f (x)), então podemos tirar
•C •V •A •Ṕ •T •Ṕ. 188 •Ú •S
γ
Portanto, as funções y = Aaλx + c, ou melhor, y = Aa ln(a) λx + c (com A e c reais e sendo
a base a qualquer real positivo), formam o conjunto de funções que contém (todas) as
soluções da equação diferencial
dy
=γy.
dx
Dado γ e adotando-se a base a para a função exponencial, então λ = γ/ ln(a). Observe que a base pode ser escolhida arbitrariamente, em particular, a base e normaliza
o “incômodo” fator ln(a), uma vez que ln(e) = 1. É por esse motivo que, quando
estamos trabalhando com derivadas, integrais ou com equações diferenciais, adotamos
exponenciais e logaritmos na base natural e. Por essa razão, no que se segue, quando a
base não for explicitamente indicada, estaremos considerando a base e.
Teorema 2.10.2. Sejam x, z ∈ R+ e y ∈ R, então:
loga (xz) = loga (x) + loga (z)
loga (x y ) = y loga (x) .
(2.36)
(2.37)
uma relação envolvendo as derivadas dessas funções, ou seja, a derivada da função composta
g( f (x + ∆x)) − g( f (x))
g( f (x + ∆x)) − g( f (x)) ∆y
dz
= lim
= lim
·
dx ∆x→0
∆x
∆y
∆x
∆x→0
= lim
∆x→0
=
g(y + ∆y) − g(y) f (x + ∆x) − f (x)
·
∆y
∆x
dg df
.
dy y= f (x) dx
•C •V •A •Ṕ •T •Ṕ. 189 •Ú •S
Prova. A prova da primeira equação já foi feita para o caso em que a = e, deixamos o
presente caso como exercício. Para (2.37), temos:
β = loga (x y )
aβ = x y
⇒
logo, se x , 1,
logx (aβ ) = y
⇒
⇒
y
logx (aloga (x ) ) = y
1
1
logx (x y ) =
y
logx (a)
logx (a)
⇒
⇒
logx (x y ) = y ⇒
loga (x y ) = y
1
logx (a)
porém, como loga (α)· logb (a) = logb (α), então
loga (b) =
e, daí,
1
logb (a)
(2.38)
loga (x y ) = y loga (x) .
Falta demonstrar a proposição para o caso em que x = 1. Como 1 y = 1, então
loga (1 y ) = loga (1) = 0 = y 0 = y loga (1) .
•C •V •A •Ṕ •T •Ṕ. 190 •Ú •S
2.10.4.
Funções algébricas e funções transcendentes
Um polinômio de ordem n (n ∈ N) é uma função real que pode ser expressa na forma
(observa-se que a afirmação n ∈ N significa que o número de parcelas é finito)
f (x) = an xn + an−1 xn−1 + . . . + a1 x + a0 ,
onde
an , 0 .
Dizemos que uma função real (ou complexa) é função algébrica se for possível descrevê-la por meio de operações algébricas (sobre o corpo dos reais ou dos complexos)
envolvendo: adição (subtração), multiplicação (divisão) ou potenciação (com expoentes
racionais), com número finito de parcelas ou de fatores. Uma função real que não seja
função algébrica é chamada função transcendente.
Alguns exemplos de funções transcendentes são: as funções trigonométricas a função exponencial, a função logaritmo, etc. Essas funções apresentam uma álgebra própria
no que diz respeito aos seus argumentos36 e os valores locais da função considerada,
mas como calcular o seu valor para um dado elemento do domínio? O desenvolvimento de uma função em série de Taylor [§2.11, pág. 192] fornece uma resposta a essa
questão, possibilitando o cálculo aproximado (com aproximação controlada) por meio
de multiplicações e adições, isto é, por meio de um polinômio que aproxima a função
desejada (numa região do seu domínio).
36 Note-se que a função exponencial aplicada a um grupo multiplicativo define um isomorfismo com um
grupo aditivo [ver (2.24)], enquanto a função logaritmo aplicada a um grupo aditivo defini um isomorfismo
com um grupo multiplicativo [(2.23)].
•C •V •A •Ṕ •T •Ṕ. 191 •Ú •S
2.11.
Série de Taylor
O desenvolvimento em série de Taylor possibilita meio eficaz para determinar o valor
local (ou em uma determinada região do domínio) de uma função transcendente aproximada por meio de um polinômio, de tal maneira que se pode controlar a aproximação
efetuada mediante o resto de Lagrange. Demonstramos neste parágrafo o teorema de
Taylor para uma função de uma variável real, e aproveitamos a oportunidade para
incluir o §2.11.2, abordando o mesmo assunto para funções de várias variáveis37 .
2.11.1.
Série de Taylor para função de uma variável
Seja a função f (x) ∈ C1 , com38 x ∈ (a, b); então, denotando por f (n) (x) a derivada de ordem
n da função f (x), vale a seguinte identidade:
Z
f (b) ≡ f (a) +
b
f (1) (x) dx
(2.39)
a
37
Esse é o motivo de estarmos empregando o termo “região”, ao invés de “intervalo”.
Denotamos por Cn o conjunto das funções reais contínuas com a derivada de ordem n bem definida no
intervalo considerado, n ∈ N.
38
•C •V •A •Ṕ •T •Ṕ. 192 •Ú •S
Logo, se f (x) ∈ C2 em (a, b), podemos abordar a integral do segundo membro de (2.39)
por partes39 :
u = f (1) (x) du = f (2) (x) dx
dv = dx
v=x+c
sendo c uma constante de integração (arbitrária) da qual poderemos dispor da forma
mais conveniente. A equação (2.39) fica:
Z
f (b) ≡ f (a) + f (1) (b) · (b + c) − f (1) (a) · (a + c) −
b
(x + c) · f (2) (x) dx ,
(2.40)
a
tomando c = −b, conseguimos anular o segundo termo do segundo membro de (2.40),
com o qual se obtém:
Z
f (b) ≡ f (a) + f
(1)
(a) · (b − a) +
b
(b − x) · f (2) (x) dx .
(2.41)
a
Se f (x) ∈ C3 em (a, b), podemos abordar a integral do segundo membro novamente por
partes:
du = f (3) (x) dx
u = f (2) (x)
dv = (b − x) dx
v = − 12 (b − x)2 ,
39 A integração por partes baseia-se na derivada (ou na diferencial) do produto de funções, i.e.,
u dv + v du ⇒ u dv = d(u v) − v du .
d(u v) =
•C •V •A •Ṕ •T •Ṕ. 193 •Ú •S
obtém-se:
Z
f (b) ≡ f (a) + f
(1)
(a) · (b − a) +
1
2
f
(2)
b
(a) · (b − a) +
2
a
1
2
(b − x)2 f (3) (x) dx .
A equação anterior leva-nos a propor e demonstrar a seguinte proposição:
Teorema 2.11.1 (de Taylor). Seja y = f (x) uma função definida em um domínio D =
[α, β] ⊂ R e tal que f (x) ∈ Cm no intervalo (α, β), m ∈ N. Então, para todo n ∈ Im−1 e para
qualquer a, b ∈ D, vale:
n
X
1 (k)
f (a) · (b − a)k + Rn ,
(2.42)
f (b) =
k!
k=0
onde
1
Rn =
n!
Z
b
f (n+1) (x) · (b − x)n dx .
(2.43)
a
Prova. Provaremos por indução matemática; com efeito. Se n = 1, a equação (2.41) diz
que a proposição é verdadeira. Supondo que n ≤ m−2 e que a proposição seja válida
para k = n, então, por hipótese, vale:
f (b) =
k
X
1 (r)
f (a) · (b − a)r + Rk ,
r!
r=0
onde
Rk =
1
k!
Z
(2.44)
b
f (k+1) (x) · (b − x)k dx .
(2.45)
a
•C •V •A •Ṕ •T •Ṕ. 194 •Ú •S
Como k ≤ m−2 e f ∈ Cm , então, integrando Rk por partes:
du = f (k+2) (x) dx
u = f (k+1) (x)
−1
1
k
v = (k+1)!
(b − x)k+1
dv = k! (b − x) dx
(2.46)
e
Rk =
=
−1
(k+1)!
b Z
(b − x)k+1 f (k+1) (x) +
=
1
(k+1)!
f (k+1) (a) · (b − a)k+1 + Rk+1
a
a
b
1
(k+1)!
f (k+2) (x) · (b − x)k+1 dx
(2.47)
e daí, de (2.44),
f (b) =
k
X
1 (r)
1
f (a) · (b − a)r +
f (k+1) (a) (b − a)k+1 + Rk+1 .
r!
(k
+
1)!
r=0
Finalmente:
f (b) =
k+1
X
1 (r)
f (a) · (b − a)r + Rk+1 .
r!
r=0
(2.48)
Isto é, se vale para k = m−2, então a proposição vale para k+1, qualquer que seja m ∈ N
e k ∈ Im−2 . Logo, como vale para k = 1, a proposição está demonstrada (por indução
matemática).
•C •V •A •Ṕ •T •Ṕ. 195 •Ú •S
Esse teorema possui um significado importante, a saber: possibilita calcular com
uma aproximação controlada o valor de uma função, respeitadas as hipóteses do teorema, num ponto qualquer do seu domínio em termos do valor da função e de suas
derivadas em outro ponto do seu domínio (geralmente de valor mais facilmente determinado), aproximando-a por um polinômio, i.e.,
f (x) ≈
n
X
1 (k)
f (a) · (x − a)k ,
k!
(2.49)
k=0
com o erro da aproximação determinado por Rn , conhecido como resto de Lagrange.
Se a função possuir todas as derivadas f (n) (x) no ponto a, ∀n ∈ N, i.e., f ∈ C∞ em a,
então a função no ponto x do domínio pode ser dada pela série40 (conhecida como série
de Taylor)
∞
X
1 (k)
f (x) =
f (a) · (x − a)k ,
(2.50)
k!
k=0
quando ocorrer
lim Rn = 0
n→∞
(ver [17, Cap. 14]). Nesse caso dizemos que a função é uma função analítica.
40
A notação
∞
X
k=0
deve ser entendida como a indicação do limite: lim
n→∞
n
X
.
k=0
•C •V •A •Ṕ •T •Ṕ. 196 •Ú •S
2.11.2.
Série de Taylor
para função de várias variáveis
Seja uma função de várias variáveis. Um objetivo mais imediato em física pode ser uma
aplicação direta nos potenciais para um sistema de várias partículas, adotaremos uma
notação que evidencie essas características. Seja um sistema formado por N partículas
localizadas pelos respectivos vetores posição ~ri .
Adotando um sistema cartesiano de coordenadas Ox1 x2 x3 , com versores {ı̂ = ê1 , ̂ =
ê2 , k̂ = ê3 }, denotaremos:
xiα = ~ri · êα .
Então seja uma função
V = V (x11 , x12 , x13 , . . . , xN1 , xN2 , xN3 ) = V (xiα ) .
(2.51)
Ainda, se o vetor
~ri0 =
3
X
xiα0 êα
α=1
localiza uma posição de referência relativa à partícula i, como por exemplo a posição
de equilíbrio, e considerando [λ, qiα ∈ R, i ∈ IN , α ∈ I3 ]
xiα = xiα0 + λ qiα ,
temos que
(2.52)
V (xiα ) = V (xiα0 + λ qiα ) = g(λ) .
•C •V •A •Ṕ •T •Ṕ. 197 •Ú •S
Dessa forma:
V (xiα0 + λ qiα ) − V (xiα0 ) = g(λ) − g(0) .
(2.53)
Logo, pelo teorema de Taylor [Teorema 2.11.1] para funções de uma variável:
g(λ) − g(0) =
∞
X
1 dn
g
λn .
n! dλn λ=0
(2.54)
n=1
Mas, pela regra da cadeia,
j
N,3
dg X ∂V ∂xβ
=
,
j
dλ
∂x ∂λ
j,β
β
de onde, por (2.52), tiramos para λ = 0:
X ∂ dg j
=
qβ j V dλ λ=0
∂x
j,β
β
.
(2.55)
i
xα0
Logo, de (2.54), (2.55) e (2.53),
n ∞
X
X
1
j ∂
V (xiα0 + λ qiα ) − V (xiα0 ) =
qβ j V
n!
∂xβ n=1
j,β
λn
j
xβ0
•C •V •A •Ṕ •T •Ṕ. 198 •Ú •S
e daí, para λ = 1, obtemos
xiα = xiα0 + qiα
e, finalmente:
n ∞
X
X ∂ 1
j
qβ j V V (xiα0 + qiα ) = V (xiα0 ) +
n!
∂xβ n=1
j,β
(2.56)
.
(2.57)
i
xβ0
Ou ainda, em termos dos vetores posição denotados por
~r = ~r1 , ~r2 , . . . , ~rN
e por ~r0 = ~r10 , ~r20 , . . . , ~rN0 :
N
∞
n
X
1 X
~i V ,
(~ri − ~ri0 ) · ∇
V ( ~r ) = V ( ~r0 ) +
~r0
n!
n=1
(2.58)
i=1
~i denota o gradiente na posição ~ri [da partícula i].
onde ∇
Neste parágrafo, consideramos uma função V qualquer (não sendo necessariamente
uma energia potencial) que possui todas as derivadas (i.e., trata-se de uma função
analítica). A equação (2.57) fornece o desenvolvimento em série de Taylor da função de
várias variáveis V (xiα ).
•C •V •A •Ṕ •T •Ṕ. 199 •Ú •S
2.12.
Estudo da função do segundo grau
2.12.1.
Observações preliminares,
diferencial de uma função
Estudado o teorema de Taylor, ficamos aptos para duas observações que revelam a
importância das funções do primeiro grau e das funções do segundo grau.
Se a função y = f (x) for derivável no ponto x = a do domínio de f , então a função do
primeiro grau
d f + f (a) = g(g)
y=
dx a
é uma boa aproximação de f (x) numa vizinhança de x = a, essa aproximação pode ser
avaliada pelo resto de Lagrange, de tal forma que se pode escrever:
d f ∆x ,
∆ f = f (x) − f (a) ≈
dx a
onde ∆x = x−a. Quando se está fazendo uso dessa aproximação, costuma-se utilizar
o conceito de diferencial de uma função, que é justamente a aproximação linear, ou
a linearização, ou, ainda, a aproximação por meio de uma função do primeiro grau.
Denota-se:
d f d f (x − a)
∆x .
df =
ou
df =
dx a
dx a
•C •V •A •Ṕ •T •Ṕ. 200 •Ú •S
Se considerarmos a função identidade y = x, então tiramos:
d f (x − a) = 1 (x − a) = ∆x .
dx =
dx a
Dessa forma, quando x for uma variável independente, podemos escrever indiscriminadamente:
dx = ∆x .
Esse é o motivo pelo qual se denota a diferencial da função f (x), de uma variável, na
forma:
df
d f dx
ou
df =
dx ;
d f a =
dx a
dx
df
com respeito a essa notação, não se deve confundir o símbolo dx (que denota derivada
da função f ) com uma fração. Para a função de várias variáveis f (x1 , x2 . . . xn ), podemos
escrever a sua diferencial como:
df =
n
X
∂f
i=1
∂xi
dxi .
Quando se está precisando aproximar uma função na vizinhança de um ponto
para o qual a derivada (local) é nula, o teorema de Taylor faz uma aproximação em
primeira ordem 41 por uma função constante, mesmo que a função a ser aproximada não
41
Isto é, a aproximação que se obtém quando se trunca a série de Taylor na parcela que contém o termo de
primeira ordem em ∆x.
•C •V •A •Ṕ •T •Ṕ. 201 •Ú •S
seja constante. Nesses casos, para conseguir uma melhor avaliação, ou melhor, uma
aproximação mais fina, é necessário que se considere a parcela seguinte da seqüência
de Taylor:
d2 f d f 2
1
(x − a) + 2
f (x) ≈ f (a) +
(x − a)
dx a
dx2 a
df (como dx = 0)
a
≈ f (a) + k (x − a)
1
2
2
onde
d2 f k=
.
dx2 a
Será que a parcela 12 k(x−a)2 faz o leitor lembrar algo bem conhecido em mecânica? É...,
tem o aspecto da energia potencial de uma força elástica cuja componente na direção
do eixo Ox é da forma F(x) = −k(x−a), para a qual: x = a é a posição de equilíbrio e a
constante elástica k é igual à derivada segunda da força (em relação à posição) calculada
na posição de equilíbrio. Essa observação leva a uma conclusão muito importante para
a física: se um sistema possui uma configuração de equilíbrio e as forças envolvidas
dependem apenas da configuração do sistema (i.e., da posição de cada parte constituinte
do sistema), então é possível aproximar as forças de interação por forças elásticas,
independentemente das forças envolvidas serem elásticas, ou não.
Em física, é um procedimento muito comum expressar uma lei na forma diferencial,
i.e., por uma maneira em que se relaciona o estado de uma grandeza física numa posição
•C •V •A •Ṕ •T •Ṕ. 202 •Ú •S
do espaço–tempo com um efeito ou efeitos que ocorrem em uma vizinhança de uma
posição ou de um instante no espaço–tempo. A linearização que decorre das leis que
podem ser expressas em forma diferencial bem indica a importância do estudo da
álgebra linear.
2.12.2.
Principais características da função do segundo grau
A forma geral de uma função do segundo grau é:
y = a x2 + b x + c ,
onde a, b e c são reais quaisquer, com a , 0 (do contrário, estaríamos tratando com função
do primeiro grau, já estudada no §2.1). As raízes da função do segundo grau (definida
com domínio num corpo qualquer) já foram determinadas no §1.4.3. Denotaremos
essas duas raízes por x1 e x2 , assim:
1 √ 2
b
+
· b − 4ac
2a 2a
b
1 √ 2
x2 = −
−
· b − 4ac .
2a 2a
x1 = −
A expressão sob a radiciação é conhecida como discriminante da função do segundo
grau e denotada por:
√
∆ = b2 − 4 a c .
•C •V •A •Ṕ •T •Ṕ. 203 •Ú •S
Em termos do discriminante:
∆ > 0, há duas raízes reais e distintas;
se
∆ = 0, há duas raízes reais iguais;
∆ < 0, não há raízes reais, e sim duas raízes complexas conjugadas.
Se ∆ ≥ 0, essa função também pode ser expressa explicitando as suas raízes reais, na
forma (ver §1.4.3, rodapé 52):
y = (x − x1 ) (x − x2 ) .
•C •V •A •Ṕ •T •Ṕ. 204 •Ú •S
A derivada primeira42 é y0 (x) = 2ax+b, portanto a função y(x) possuirá um extremo onde
2ax+b = 0, ou seja, (se a , 0) para x = −b/(2a). Se b = 0 a função será simétrica em relação
ao eixo y, i.e., nesse caso a função do segundo grau será par (verifique! ). A derivada
segunda é 2a, portanto:
b
a > 0, − 2a é ponto de mínimo;
se
a < 0, − 2ab é ponto de máximo.
Na Fig. 2.7 ilustramos um gráfico típico de uma função do segundo grau, a concavidade da ilustração é para a > 0 e discriminante positivo.
42
Lembre-se que, pela definição de derivada de uma função:
dy
=
dx
= lim
a (x + ∆x)2 + b (x + ∆x) + c − (ax2 + bx + c)
∆x
= lim
a x2 + a (∆x)2 + 2 a x ∆x + b x + b ∆x + c − (ax2 + bx + c)
∆x
∆x→0
∆x→0
a (∆x)2 + 2 a x ∆x + b ∆x
∆x
= lim (a ∆x + 2 a x + b)
= lim
∆x→0
∆x→0
= 2ax + b .
•C •V •A •Ṕ •T •Ṕ. 205 •Ú •S
Figura 2.7: Gráfico de uma função do segundo grau: y = a x2 + b x + c
y6
c
q
x1
q
q
q
x2
x
−b
( −b
2a , 2a + c)
•C •V •A •Ṕ •T •Ṕ. 206 •Ú •S
2.13.
Representação polar dos números complexos
Se, por um lado, os complexos formam um corpo, por outro lado, em termos das definições de igualdade, de adição nos complexos e de multiplicação de real por complexo
[basta considerar um dos complexos fatores como contido nos reais], segue-se que os
complexos podem ser encarados como um espaço vetorial (EV) de dimensão dois sobre
o corpo dos reais. E mais: pela definição de norma, é um espaço vetorial normado, com
a norma coincidindo com a definição de norma dada no §1.6.
Note-se que a interpretação do corpo dos complexos como espaço vetorial não leva
em conta a definição de multiplicação entre dois complexos na sua plenitude em C,
nem considera o inverso multiplicativo de um complexo diferente de zero; em termos
de multiplicação, considera apenas o produto de um complexo de parte imaginária
nula (um real) por um complexo qualquer, desempenhando o papel do produto de um
escalar (em R) por um vetor (em C). Quando se considera a multiplicação em C, o
conjunto dos complexos (do ponto de vista algébrico) possui estrutura algébrica mais forte do
que a de espaço vetorial, a saber: de corpo43 .
Ainda sob o ponto de vista de espaço vetorial sobre os reais, uma base natural para
esse EV é formada pelos complexos z = 1 e z = i. Dessa forma, podemos representar
43 Na eletricidade e na eletrônica usam um ‘objeto’ chamado fasor, deve ser observado que um fasor
não passa de um complexo representado geometricamente por um segmento orientado, o qual não deve
ser confundido com um vetor. Afinal, não existe uma definição decente para multiplicação entre vetores,
muito menos a um vetor está associado inverso multiplicativo. Não estranhe, produto escalar e produto
vetorial não definem qualquer multiplicação decente para os vetores, tanto que a nenhum dos dois produtos
mencionados está associado inverso multiplicativo.
•C •V •A •Ṕ •T •Ṕ. 207 •Ú •S
os elementos de C geometricamente num plano onde a adição em C segue a regra do
paralelogramo, sendo mais conveniente representar os complexos 1 (um) e i (unidade
imaginária) como vetores ortogonais. Essa possibilidade de representação num plano
permite uma interpretação geométrica para o seguinte procedimento algébrico.
Proposição 2.13.1. Se z , 0 e z = (1)a+(i)b, então
"
#
√
a
b
2
2
+i √
.
z= a +b √
a2 + b2
a2 + b2
Prova. É trivial, basta pôr em evidência a norma de z.
(2.59)
Assim, como para qualquer z , 0,
"
#2 "
#2
a
b
+ √
≡1
√
a2 + b2
a2 + b2
podemos interpretar a relação (2.59) de forma que:
a
= cos(θ)
√
2
a + b2
e
b
= sen(θ)
√
2
a + b2
(2.60)
√
onde θ é o ângulo44 entre o vetor (complexo) z e o vetor base 1 = 1+i 0. Como r ≡ a2 +b2
e θ são as coordenadas polares para pontos no R2 , dizemos que o par ordenado (r, θ) é
44
Bem definido por (2.60), no intervalo [0, 2π).
•C •V •A •Ṕ •T •Ṕ. 208 •Ú •S
a representação polar do complexo z. Nesses termos, podemos escrever45 :
z = a + i b ⇔ z = r cos(θ) + i sen(θ) ,
(2.61)
onde
√
2
2
r = a + b , e
a
b
cos(θ) =
e sen(θ) = .
θ é tal que
r
r
z1 = |z1 | cos(θ1 ) + i · sen(θ1 )
, mostre que:
Problema 2.2. Dados:
z2 = |z2 | cos(θ2 ) + i · sen(θ2 )
1. z1 · z2 = |z1 | · |z2 | cos(θ1 + θ2 ) + i · sen(θ1 + θ2 ) ;
2. se z2 , 0, então
z1
|z1 | =
cos(θ1 − θ2 ) + i · sen(θ1 − θ2 ) .
z2
|z2 |
É útil a definição da potenciação para o corpo dos complexos: (ainda para expoente
45
Lembre-se que (r ≥ 0) e (r = 0 ⇔ z = 0).
•C •V •A •Ṕ •T •Ṕ. 209 •Ú •S
inteiro)
z1 ≡ z
∀z ∈ C
z
≡ zm · zn
∀z ∈ C e ∀m, n ∈ Z
(2.62a)
(2.62b)
z0 ≡ 1
1
z−1 ≡
z
m
z
zm−n ≡ n
z
∀z ∈ C − {0}
(2.62c)
∀z ∈ C − {0}
(2.62d)
m+n
2.14.
∀z ∈ C − {0} e ∀m, n ∈ Z .
(2.62e)
Definição da exponencial complexa
Conforme visto no §2.13,
qualquer z = a+i b, é possível representá-lo
dado um complexo
46
sempre na forma z = r cos(θ)+i sen(θ) , sendo r ∈ R+ a sua norma e (cos(θ)+i sen(θ)) um
complexo de norma igual a 1. Diante desse fato, ficaremos ocupados temporariamente
com os “complexos unimodulares”.
Para funções de uma variável, é bem conhecido (ver §2.11.1, pág. 192) o desenvolvimento em série de Taylor das seguintes funções: ex , cos(x) e sen(x): (demonstre a título de
46
Ver definição 1.6.2, pág. 119.
•C •V •A •Ṕ •T •Ṕ. 210 •Ú •S
exercício referente ao §2.11.1)
ex =
cos(x) =
sen(x) =
∞
X
1 n
x ,
n!
n=0
∞
X
(−1)n x2n
n=0
∞
X
n=0
(2n)!
,
(−1)n x2n+1
.
(2n + 1)!
Dessa forma, se considerarmos a mesma lei da série da exponencial aplicada (pragmaticamente) ao complexo z = i y (parte real nula) [i.e., substituindo x por iy na série de
Taylor para ex ], podemos escrever a seguinte expressão:
ei y =
∞
X
(−1)n y2n
n=0
(2n)!
+i
∞
X
(−1)n y2n+1
n=0
(2n + 1)!
.
Daí, tendo em vista a série do seno e a do cosseno, podemos identificar essa expressão
como:
ei y = cos(y) + i sen(y) .
•C •V •A •Ṕ •T •Ṕ. 211 •Ú •S
Este ensaio não significa uma demonstração. Significa a possibilidade de se definir a
função exponencial de um argumento complexo, de tal maneira que se tenha como caso
particular o correspondente para o caso das funções reais.
Definimos a função exponencial complexa ez de tal maneira que:
(
ei y ≡ cos(y) + i sen(y)
∀y ∈ R
(2.63)
z1
e · ez2 ≡ ez1 +z2
∀z1 , z2 ∈ C .
A primeira parte da definição faz a extensão para argumento imaginário puro e é
conhecida como fórmula de Euler; a segunda parte faz com que a extensão contenha o
caso real como caso particular e generaliza para um argumento complexo qualquer.
2.14.1.
Proposições
As seguintes proposições listam as principais propriedades dessa definição.
Proposição 2.14.1. ex+i y = ex ei y = ex cos (y) + i sen (y) , ∀x, y ∈ R.
Proposição 2.14.3.
1
∀z ∈ C.
ez
(ez )n = en·z ∀n ∈ Z , ∀z ∈ C.
Proposição 2.14.4.
ez , 0 ∀z ∈ C.
Proposição 2.14.5.
|ez | = eRe(z) ,
Proposição 2.14.2.
e−z =
∀z ∈ C.
•C •V •A •Ṕ •T •Ṕ. 212 •Ú •S
Proposição 2.14.6.
Proposição 2.14.7.
R.
ez = 1 ⇔ z = 2kπ i ,
∀k ∈ Z.
n
cos(y)+i sen(y) = cos(ny)+i sen(ny), para todo n em Z e y em
A última relação é conhecida como fórmula de Moivre. Apresentaremos a seguir a
demonstração para cada uma das proposições anteriores.
Prova da Proposição 2.14.1. A demonstração da proposição 2.14.1 é trivial, segue da própria definição de exponencial complexa.
Prova da Proposição 2.14.2.
e−z = e−x · e− i y
1 = x cos(y) − i sen(y)
e
1
1
= x
e cos(y) + i sen(y)
1 1
= x iy
e e
1
= z
e
Prova da Proposição 2.14.3. Da própria definição de exponencial complexa e da definição de potenciação, é imediato que essa propriedade é válida para n = 1 e, quando z , 0,
•C •V •A •Ṕ •T •Ṕ. 213 •Ú •S
para n = 0. Demonstraremos essa proposição por indução matemática. Se é válida para
n = m, com m ∈ N, então
m
daí
ex · ei y = em x · ei m y
m
ez · (ez ) = ex · ei y · em x · ei m y
= (ex · em x ) · ei y · ei m y
= e[m+1] x · ei[m+1] y .
Prova da Proposição 2.14.4. Como todo complexo pode ser escrito na forma z = x + i y,
então
ez = ex · cos(y) + i sen(y) .
Como ex ,
0, ∀x ∈ R, e como cos(y) e sen(y) não podem ser simultaneamente nulos,
i y afinal e ≡ 1, ∀y ∈ R, então ez , 0, ∀z ∈ C.
Prova da Proposição 2.14.5.
|ez |2 = (ex · ei y ) · (ex · e− i y ) = e2x
= eRe(z) .
Prova da Proposição 2.14.6. Como ez = ex cos(y)+i sen(y) , se z = 2kπ i, então ez = 1, ∀k ∈ Z.
Reciprocamente, se ez = 1, então sen(y) = 0, daí cos(y) = 1 e x = 0. Portanto, y = 2kπ e,
finalmente47 , z = 2kπ i.
|ez | = ex
47
Isso já indica que teremos problemas com o logaritmo de argumento complexo.
•C •V •A •Ṕ •T •Ṕ. 214 •Ú •S
Prova da Proposição 2.14.7. Das propriedades anteriores, a demonstração da chamada
fórmula de Moivre fica trivial:
n
n
ei θ = ei n θ ⇒
cos(θ) + i sen(θ) = cos(n θ) + i sen(n θ) .
Tendo em vista a definição em (1.6.3), temos que, para z = rei θ , z̄ = re− i θ . Essa propriedade é conseqüência imediata da função cosseno ser par e da função seno ser ímpar.
Além disso, a parte real e a parte imaginária [definição 1.6.1, pág. 119] do complexo
z = rei θ , podem ser escritas como:
iθ
−iθ
1
r
e
−
r
e
Re(z)
=
2
Im(z) = 1 r ei θ + r e− i θ .
2
Uma conseqüência imediata é que: (ver §2.15)
iα
−iα
1
cos(α) = 2 e + e
sen(α) = 1 ei α − e− i α .
2
2.14.2.
Seno e cosseno da soma
Não podemos perder a oportunidade em mostrar a grande utilidade dos números
complexos para “realizar” as transformações trigonométricas, principalmente as que
•C •V •A •Ṕ •T •Ṕ. 215 •Ú •S
envolvem o seno e o cosseno. Consideremos o produto
ei α ei β = cos (α) +i sen (α) cos (β) +i sen (β) , portanto
ei(α+β) = cos (α) cos (β) −sen (α) sen (β) +
+ i cos (α) sen (β) +sen (α) cos (β)
Como ei(α+β) = cos(α+β)+i sen(α+β), então
cos(α + β) = cos(α) cos(β) − sen(α) sen(β)
sen(α + β) = cos(α) sen(β) + sen(α) cos(β) .
E quanto as derivadas das funções trigonométrica?
2.14.3.
Derivadas do seno e do cosseno
Ora, como
d ix
ix
dx e = i e ,
então
d
d
cos(x) + i
sen(x) = i cos(x) − sen(x)
dx
dx
ou seja,
d
dx cos(x) = − sen(x)
d
sen(x) = cos(x) .
dx
•C •V •A •Ṕ •T •Ṕ. 216 •Ú •S
Não deve ficar despercebida uma interpretação e um aspecto de grande utilidade
para o complexo ei β . Dado z = rei θ , temos que ei β z = rei(θ+β) . Logo, o complexo ei β
pode ser encarado como um operador que realiza uma rotação (de um ângulo β) no
plano complexo48 . Mesmo quando estamos trabalhando com fenômenos (físicos) que
ocorrem num plano do espaço físico (que não é um plano complexo), é sempre possível
complexificar esse plano, isto é, adotando um sistema de coordenadas cartesianas xOy,
podemos associar ao ponto de coordenadas (x, y) o complexo z = x+i y. É fácil verificar
que essa correspondência é um isomorfismo entre os vetores no R2 e os complexos
munidos da operação de adição e de multiplicação de real por complexo. Mesmo com
tal facilidade, veremos essa afirmação com mais detalhes.
Seja V2 um espaço vetorial de dimensão 2 sobre os reais e {ı̂, ̂} uma base ortonormal
em V2 . Entenderemos por complexificação de V2 a bijeção c : V2 → C, tal que
c a ı̂ + b ̂ = a + i b
∀a, b ∈ R .
Na realidade, uma complexificação de V2 significa mais de que uma bijeção, é um
isomorfismo entre V2 e C —afinal o corpo dos complexos, para as operações de adição
e multiplicação por real, pode ser encarado como um espaço vetorial de dimensão 2 sobre
48 Qualquer complexo z = a = i b = |z|ei θ sofre a mesma rotação, sendo transformado no complexos |z|ei(θ+β) .
Essa é uma forma de representar o grupo de rotações no plano, um grupo comutativo –verifique que se trata de
um grupo comutativo–.
•C •V •A •Ṕ •T •Ṕ. 217 •Ú •S
o corpo dos reais—. Para verificar o isomorfismo basta verificar que:
c( a1 ı̂+b1 ̂ + a2 ı̂+b2 ̂ ) = c((a1 +a2 ) ı̂ + (b1 +b2 ) ̂)
= (a1 + a2 ) + i(b1 + b2 )
= (a1 + i b1 ) + (a2 + i b2 )
= c(a1 ı̂ + b1 ̂) + c(a2 ı̂ + b2 ̂) ,
e mais:
c(γ aı̂ + b ̂ ) = c( γ aı̂ + γ b ̂ )
= (γ a) + i (γ b) = γ (a + i b)
= γ c((aı̂ + b ̂)) .
A imagem dessa complexificação é o que usam chamar de fasor.
2.15.
Funções hiperbólicas
Nosso plano para este parágrafo é colocar inicialmente as definições mais usuais para
as funções hiperbólicas e, finalmente, relacioná-las com as funções trigonométricas por
meio da função exponencial complexa, obtendo assim uma definição unificada para
funções correspondentes dessas duas famílias de funções.
•C •V •A •Ṕ •T •Ṕ. 218 •Ú •S
2.15.1.
Definição das funções hiperbólicas
como funções reais
A função exponencial não possui paridade bem definida, mas pode ser expressa naturalmente como a soma de uma função par e de uma função ímpar (ver Teorema 2.0.3,
pág. 125), com efeito,
ex = 12 ex + e−x + 12 ex − e−x .
Essas duas parcelas são funções importantes, nesse sentido
cosh(x) = 21 ex + e−x
senh(x) = 12 ex − e−x
denotam, respectivamente, o cosseno hiperbólico e o seno hiperbólico. Trivialmente, tendo
em vista a própria motivação que usamos para defini-las, tem-se:
cosh(x) + senh(x) = ex
cosh(x) − senh(x) = e−x .
Além dessas duas propriedades, tomando-se o quadrado dessas funções, é fácil verificar
(verifique! ) a principal relação entre as funções hiperbólicas, análoga ao teorema de
Pitágoras para as funções trigonométricas.
cosh2 (x) − senh2 (x) = 1 .
(2.64)
•C •V •A •Ṕ •T •Ṕ. 219 •Ú •S
Essa relação motiva o termo “funções hiperbólicas”, uma vez que possui o aspecto da
equação de uma hipérbole em coordenadas cartesianas49 ; em contraste com a relação
trigonométrica cos2 (x) + sen2 (x) = 1, que possui o aspecto da equação cartesiana de
um círculo50 , o que motiva o termo “funções circulares” como alternativo para funções
trigonométricas.
Definem-se ainda as seguintes funções (hiperbólicas):
senh(x)
cos(x)
1
sech(x) =
cosh(x)
1
csch(x) =
senh(x)
1
coth(x) =
tanh(x)
tanh(x) =
ex − e−x
ex + e−x
2
= x
e + e−x
2
= x
e − e−x
cosh(x) ex + e−x
=
=
senh(x) ex − e−x
=
(2.65a)
(2.65b)
(2.65c)
(2.65d)
que são chamadas, respectivamente, tangente hiperbólica, secante hiperbólica, cossecante
hiperbólica e cotangente hiperbólica. Além da relação (2.64), é fácil demonstrar as seguintes
relações:
tanh2 (x) + sech2 (x) = 1
2
2
coth (x) − sech (x) = 1 .
49
50
(2.66)
(2.67)
Basta fazer X = cosh(x) e Y = senh(x); ver §3.8, equação (3.31).
Basta fazer X = cos(x) e Y = sen(x); ver §3.6, equação (3.25).
•C •V •A •Ṕ •T •Ṕ. 220 •Ú •S
Da definição de senh(x), tiramos o seno hiperbólico da soma dos argumentos:
senh(x + y) =
=
ex+y − e−x−y = 12 ex e y − e−x e−y =
h
ih
i
= 12 cosh(x) + senh(x) cosh(y) + senh(y) −
h
ih
i
− 12 cosh(x) − senh(x) cosh(y) − senh(y)
1
2
portanto, como cosh(−x) = cos(x) e senh(−x) = − senh(x), i.e., como senh(x) é função
ímpar e cosh(x) é função par:
senh(x ± y) = cosh(x) senh(y) ± senh(x) cosh(y) ,
(2.68)
analogamente, tira-se:
cosh(x ± y) = cosh(x) cosh(y) ± senh(x) senh(y)
tanh(x) ± tanh(y)
tanh(x ± y) =
1 ± tanh(x) tanh(y)
coth(x) ± coth(y)
coth(x ± y) =
.
1 ± coth(x) coth(y)
(2.69)
(2.70)
(2.71)
São também úteis as relações:
•C •V •A •Ṕ •T •Ṕ. 221 •Ú •S
senh(2x) = 2 senh(x) cosh(x)
2
(2.72)
2
cosh(2x) = cosh (x) + senh (x)
(2.73)
2
= 2 cosh (x) − 1
= 2 sinh2 (x) + 1
2 tanh(x)
.
tanh(2x) =
1 + tanh2 (x)
(2.74)
Problema 2.3. Demonstre as relações hiperbólicas para o argumento metade.
Problema 2.4. Demonstre as relações:
senh(P) + senh(Q) = 2 senh
cosh(P) + cosh(Q) = 2 cosh
P + Q
2
P + Q
cosh
P − Q
2
P − Q
cosh
2
2
P − Q
P + Q
senh
senh(P) − senh(Q) = 2 cosh
2
2
P + Q
P − Q
cosh(P) − cosh(Q) = 2 senh
senh
.
2
2
•C •V •A •Ṕ •T •Ṕ. 222 •Ú •S
2.15.2.
Derivadas das funções hiperbólicas
Tira-se imediatamente da definição de seno hiperbólico:
d
d
senh(u) =
dx
dx
1
2
eu − e−u =
= cosh(u)
1
2
eu + e−u
du
dx
du
.
dx
Deixamos como exercício a demonstração das seguintes relações:
d
du
senh(u) = cosh(u)
dx
dx
du
d
2
tanh(u) = sech (u)
dx
dx
d
du
sech(u) = − sech(u) tanh(u)
dx
dx
2.15.3.
d
du
cosh(u) = senh(u)
dx
dx
d
du
2
coth(u) = − csch (u)
dx
dx
d
du
csch(u) = − csch(u) coth(u)
.
dx
dx
Funções hiperbólicas inversas
Seja u = senh (v), queremos definir a função inversa v = f (u), a qual denotamos
v = senh−1 (v)
•C •V •A •Ṕ •T •Ṕ. 223 •Ú •S
e chamamos argumento do seno hiperbólico ou seno hiperbólico inverso. Assim, da definição
de seno hiperbólico,
2 u = ev − e−v
⇒
2 u ev = e2v − 1
⇒
e2v − 2 u ev − 1 = 0 ,
portanto, resolvendo a equação do segundo grau em ev ,
√
ev = u ± u2 + 1 ,
√
como ev > 0 e u2 +1 > |u|, então devemos ter:
√
√
ev = u + u2 + 1 ⇒ v = ln(u + u2 + 1) ,
o que permite a definição, para x ∈ R:
senh−1 (x) = ln(x +
√
x2 + 1) .
(2.75)
Tratando-se de uma função ímpar não-periódica, a função senh(x) é uma bijeção em R,
portanto a sua função inversa está garantida, sem necessidade de qualquer restrição.
O que não ocorre quando consideramos o cosseno hiperbólico, que, sendo uma função
par, não pode ser uma injeção em R, com efeito, para u = cosh(v), da definição:
√
2 u = ev + e−v ⇒ e2v − 2uev + 1 = 0 ⇒ ev = u ± u2 − 1
e, para |x| > 1, temos duas funções que podem ser definidas:
√
cosh−1
x2 − 1)
+ (x) = ln(x +
√
cosh−1
x2 − 1)
− (x) = ln(x −
•C •V •A •Ṕ •T •Ṕ. 224 •Ú •S
que podemos escrever de forma unificada51 o cosseno hiperbólico inverso:
√
cosh−1
± (x) = ln(x ±
x2 − 1) .
(2.76)
Para u = tanh(v), temos:
ev − e−v
u= v
e + e−v
v
−v u e +e
= ev − e−v
u e2v + 1 = e2v − 1
(u − 1)e2v = −(u + 1)
u+1
e2v =
,
1−u
portanto, podemos exprimir a tangente hiperbólica inversa:
tanh−1 (x) ≡
1
2
ln
x+1
,
1−x
|1| < 1 .
(2.77)
51 Usualmente não se faz a distinção cosh−1 (x), denota-se apenas cosh−1 (x), mesmo mantendo o sinal ± no
±
segundo membro.
•C •V •A •Ṕ •T •Ṕ. 225 •Ú •S
Para u = coth(v):
ev + e−v
ev − e−v
e2v + 1
= 2v
e −1
=1+u
u+1
=
u−1
u=
(u − 1)e2v
e2v
para |x| > 1 ,
portanto, define-se cotangente hiperbólica inversa:
coth−1 (x) =
1
2
ln
x+1
,
x−1
|x| > 1 .
(2.78)
Para u = sech(v):
2
ev + e−v
u e2v − 2 ev + u = 0
o
√
1 n
ev =
2 ± 4 − 4 u2
2u
√
1 ± 1 − u2
2v
e =
,
para |x| > 1 ,
u
u=
•C •V •A •Ṕ •T •Ṕ. 226 •Ú •S
portanto temos duas funções para definir a secante hiperbólica inversa:
√
sech−1
± (x)
= ln
1±
1 − x2
,
x
0<x≤1.
Analogamente define-se cossecante hiperbólica inversa:
√
1 + 1 − x2
ln
, x>0
x
csch−1 (x) =
√
1 − 1 − x2
ln
, 0<x.
x
(2.79)
(2.80)
Para tirar as expressões das derivadas das funções hiperbólicas inversas, podemos
calculá-las diretamente das definições anteriores ou usando o teorema da derivada da
função inversa (ver pág. 164). Deixamos a obtenção das seguintes relações envolvendo
•C •V •A •Ṕ •T •Ṕ. 227 •Ú •S
as derivadas das funções hiperbólicas como exercício.
d
1
du
senh−1 (u) = √
dx
u2 + 1 dx
1
d
du
cosh−1
± (u) = ± √
dx
u2 − 1 dx
d
1
du
tanh−1 (u) =
2
dx
1 − u dx
d
1
du
−1
csch (u) = − √
2
4
dx
u + u dx
d
1
du
sech−1
± (u) = ∓ √
2
dx
u 1 − u dx
d
1 du
coth−1 (u) =
.
dx
1 − u2 dx
2.15.4.
(2.81a)
(2.81b)
(2.81c)
(2.81d)
(2.81e)
(2.81f)
Relação entre
as funções hiperbólicas e
as funções trigonométricas
Em termos de função com domínio sobre os reais, não há relação entre as funções
hiperbólicas e as funções trigonométricas. Porém, estendendo essas funções complexas e usando a fórmula de Moivre (ver Proposição 2.14.7, pág. 213) para as funções
•C •V •A •Ṕ •T •Ṕ. 228 •Ú •S
complexas, teremos:
ei x = cos(x) + i sen(x)
e− i x = cos(x) − i sen(x) ,
daí
−ix
1 ix
cos(x) = 2 (e + e )
sen(x) = 21i (ei x − e− i x ) = − i 21 (ei x − e− i x ) ,
portanto, estendendo o argumento das funções seno e cosseno aos complexos, fazendo
x = i u, com u ∈ R, obtemos:
u
1 −u
cos(i u) = 2 (e + e ) = cosh(u)
(2.82)
−u
1
sen(i u) = 2 i (e − eu ) = i senh(u) .
Reciprocamente,
ex + e−x
cosh(x)
=
2
ex − e−x
senh(x) =
2
⇒
⇒
ei u + e− i u
= cos(u)
2
ei u − e− i u
senh(i u) =
= i sen(u) .
2
cosh(i u) =
(2.83)
As outras relações podem ser obtidas de forma análoga, bem como as relações entre as
derivadas e entre as integrais dessas funções, deixamos como problema.
•C •V •A •Ṕ •T •Ṕ. 229 •Ú •S
Parte II
Geometria
•C •V •A •Ṕ •T •Ṕ. 230 •Ú •S
Capítulo 3
Estudo das cônicas
3.1.
Introdução
Trataremos neste capítulo das cônicas em coordenadas polares, visando principalmente
a geometria das órbitas no problema de Kepler, para o movimento de uma partícula
num campo central.
Duas são as abordagens alternativas: com base em uma definição unificada ou definindo-se cada cônica em separado. Essas duas abordagens podem ser contrastadas
em [29] e em [21]. Optaremos pela primeira.
•C •V •A •Ṕ •T •Ṕ. 231 •Ú •S
Segue-se uma definição unificada para as cônicas.
Definição 3.1.1. Uma cônica é uma curva plana, lugar geométrico dos pontos (P) cuja
razão entre a distância PF de um ponto da curva a um ponto fixo (F), chamado foco, e a
uma reta PQ (∆), chamada diretriz, é constante e chamada excentricidade (ε = FP/PQ) da
cônica. Quanto à excentricidade, as cônicas são classificadas como: (ver Fig. 3.1)
ε=0 :
0
<
ε
<1 :
ε=1 :
ε>1 :
círculo
elipse
parábola
hipérbole.
•C •V •A •Ṕ •T •Ṕ. 232 •Ú •S
3.2.
Equação polar das cônicas
Tomemos o eixo polar ortogonal à diretriz (∆) e com origem (O) sobre o foco, desse
para aquele. Da definição geral das cônicas: FP = εPQ, daí (ver Fig. 3.1) tiramos:
Figura 3.1: Sistema de coordenadas utilizadas para as equações das cônicas.
y ≡ y0
6
P
r
•
∆
Q
θ
x0
D
F≡O
x
pc
ε=
r
⇒
FD − r cos(θ)
(3.1)
•C •V •A •Ṕ •T •Ṕ. 233 •Ú •S
r 1 + ε cos(θ) = ε FD ,
⇒
portanto
r=
ε FD
.
1 + ε cos(θ)
(3.2)
Se o sentido do eixo polar for invertido, então, para as novas coordenadas polares, r0 e
θ0 , teremos: r0 = r e θ+θ0 = π, isto é, θ = π−θ0 , enquanto que
PQ = FD − ε cos(θ) = FD + ε cos(θ0 ) .
(3.3)
Dessa forma, denotando pc = FD (chamado parâmetro da cônica), podemos escrever a
equação geral das cônicas em coordenadas polares:
r=
3.3.
ε pc
1 + ε cos(θ)
ou
r0 =
ε pc
.
1 − ε cos(θ0 )
(3.4)
Equações cartesianas das cônicas
Sejam dois sistemas cartesianos com origem em comum: xOy e x0 Oy0 , tais que os eixos
Ox e Ox0 são simétricos, conforme a Fig. 3.1. De (3.4), como x = r cos(θ), x0 = r0 cos(θ0 ) e
√
p
r = x2 + y2 = x02 +Y02 , tem-se:
r=
ε pc
1+ε
x
r
⇒
r + ε x = ε pc ,
•C •V •A •Ṕ •T •Ṕ. 234 •Ú •S
portanto1
q
x2 + y2 = ε pc − x
(3.5)
e, analogamente:
q
x0 2 + y0 2 = ε pc + x0
(3.6)
2
x 2 + y 2 = ε2 p c − x
2
x0 2 + y0 2 = ε2 pc + x0 .
(3.7)
ou ainda:
(3.8)
As equações (3.7) e (3.8) são equivalentes à equação (3.4), a qual é satisfeita por (3.5)
ou por:
q
x2 + y2 = −ε pc − x
(3.9)
ou, equivalentemente, por
q
1
FP =
x0 2 + y0 2 = −ε pc + x0 .
(3.10)
Essa relação pode ser obtida diretamente da definição geral das cônicas e da Fig. 3.1, uma vez que
p
x2 + y2 e PQ = pc −x.
•C •V •A •Ṕ •T •Ṕ. 235 •Ú •S
As equações (3.7) e (3.8) podem ser reescritas na forma:
y2 = ε2 − 1 x2 − 2 ε2 pc x + ε2 pc 2
y0 2 = ε2 − 1 x0 2 + 2 ε2 pc x0 + ε2 pc 2 .
(3.11)
(3.12)
Em coordenadas cartesianas, as cônicas são normalmente expressas por meio de um
sistema para o qual não ocorrem o termo linear em x ou o termo em x2 . Isso acontece
quando os eixos coordenados são os eixos de simetria da curva2 . Seja:
X = x + c
X0 = x0 + c0
(3.13)
e
Y = y
Y0 = y0 .
De (3.11), tira-se:
2
Y2 = ε2 − 1 X2 − 2 X c + c2 − 2 ε2 pc (X − c) + ε pc ,
portanto
h
i
Y2 = ε2 −1 X2 − 2X ε2 −1 c + ε2 pc +
2
+ ε2 −1 c2 + 2ε2 pc c + εpc
(3.14)
2 O estudante deve ter em mente duas situações distintas: como o campo central possui simetria esférica
em relação à fonte do campo, então o sistema de coordenadas esféricas é o sistema de coordenadas que
mais bem expressa essa simetria; por outro lado, a trajetória da partícula pode estar apoiada em uma curva
que apresenta suas próprias simetrias; são justamente os eixos de simetria de reflexão de uma cônica que
estaremos investigando a seguir.
•C •V •A •Ṕ •T •Ṕ. 236 •Ú •S
e, analogamente,
h
i
Y0 2 = ε2 −1 X0 2 − 2X0 ε2 −1 c0 − ε2 pc +
2
+ ε2 −1 c0 2 − 2ε2 pc c0 + εpc .
(3.15)
Logo, tomando3
ε2 pc
,
ε2 − 1
pc
c=− ,
2
c=−
c0 = −c ,
para
ε,1, e
(3.16a)
c0 = −c ,
para
ε=1,
(3.16b)
tem-se:
ε2 pc
ε2 − 1 X 2 − 2
, se ε , 1
2
Y =
ε −1
−2 pc X ,
se ε = 1
(3.17a)
A opção (3.16a) faz com que o colchete da segunda parcela de (3.15) seja nulo, no caso ε , 1. Quando
ε = 1, a parcela quadrática em X é nula, a parcela linear em X é igual a (−2pc X) e as parcelas que independem
de X podem ser feitas com soma nula se considerarmos a opção (3.16b). Nota-se que esse é o único caso
em que a dependência com X é apenas linear, isso reflete o fato da curva associada ao parâmetro (ε = 1) não
possuir simetria de reflexão em relação ao eixo OY.
3
•C •V •A •Ṕ •T •Ṕ. 237 •Ú •S
e
ε2 pc
ε2 − 1 X 0 2 − 2
, se ε , 1
02
Y =
ε −1
2 pc X 0 ,
se ε = 1 .
(3.17b)
Se ε , 1 e ε , 0, é mais usual apresentar as equações (3.17a) na forma da equação geral
das cônicas em coordenadas cartesianas:
2
ε2 − 1
ε2 − 1 2
2
X
−
Y =1.
(3.18)
ε2 p c 2
ε2 pc 2
As cônicas são normalmente expressas pelas relações (3.4), (3.11), (3.17) ou (3.18).
Essa última equação indica que ε = 1 e ε = 0 devem ser casos limites importantes.
3.4.
Considerações
1. Como o cosseno é uma função par, então o eixo polar adotado (i.e., a reta que
passa pelo foco e é ortogonal à diretriz) é um eixo de simetria de reflexão das
cônicas.
2. Se ε > 1 ou ε = 1, então o denominador da equação polar pode ser zero; nesse caso
a curva não será limitada, não podendo ser fechada.
•C •V •A •Ṕ •T •Ṕ. 238 •Ú •S
3. Se 0 < ε < 1, então o denominador da equação polar não pode ser nulo; nesse caso
a curva será limitada e os psides são:
ε pc
r=
, para θ = π , e
1−ε
ε pc
r =
, para θ = 0 .
1+ε
Chamados afélio e periélio, respectivamente.
4. Um ponto interseção de uma cônica com a reta que passa pelo foco e que é
ortogonal à diretriz é chamado vértice da cônica, devido a simetria esse ponto é
sempre um apside da curva em relação ao foco considerado4 .
3.5.
Elipse
Como, para a elipse, 0 < ε < 1, então de (3.4):
ε pc
ε pc
<r<
1+ε
1−ε
e a curva é limitada. Como r(θ) = r(θ+2kπ) e k ∈ Z, então a curva também é fechada,
pois r(θ) está definido para todo θ ∈ R.
4
Algumas cônicas podem apresentar mais de um foco a ela associado, como, por exemplo, a elipse e a
hipérbole, conforme veremos.
•C •V •A •Ṕ •T •Ṕ. 239 •Ú •S
As equações para a elipse são: equação polar [(3.4)]
r=
ε pc
1 + ε cos(θ)
0<ε<1
e a equação cartesiana [(3.18)]
1 − ε2
ε pc
!2
!
1 − ε2
X + 2 2 Y2 = 1 ,
ε pc
2
ε pc
a≡
√
1
− ε2
definindo
tira-se:
b = a 1 − ε2
ε
p
c
b ≡ √
1 − ε2
obtém-se assim a forma mais usual como a elipse é apresentada:
X 2 Y2
+ 2 =1.
a2
b
(3.19)
Os eixos OX e OY são eixos de simetria para a elipse.
As coordenadas do foco F (em XOY) são:
ε2 pc
,0
1−ε2
, resultado que pode ser tirado de
(3.13) e (3.16a). Como a elipse apresenta simetria em relação aos eixos OX e OY, então
apresenta também uma segunda diretriz associada a um outro foco, F0 , simétrico a F e
•C •V •A •Ṕ •T •Ṕ. 240 •Ú •S
com coordenadas
. A equação da primeira diretriz é:
−ε2 pc
,0
1−ε2
X = c + pc
=
−ε2 pc + pc − ε2 pc
,
1 − ε2
isto é:
X=
pc
1 − ε2
∀Y ∈ R .
(3.20)
Logo, das simetrias (em relação aos eixos coordenados XOY):
2
+ε p
1. ao foco F em 1−ε2c , 0 está associado a diretriz de equação
X=+
2. ao foco F0 em
−ε2 pc
,0
1−ε2
pc
;
1 − ε2
está associado a diretriz de equação
X=−
pc
.
1 − ε2
•C •V •A •Ṕ •T •Ṕ. 241 •Ú •S
A distância entre os focos é:
FF0 = 2
ε2 pc
= 2εa ,
1 − ε2
(3.21)
+εp
enquanto os apsides da elipse ocorrem para5 θ = 0 e para θ = π. Ou seja: Y= 0 e X= 1+εc ;
−εp
+εp
−εp
ou Y= 0 e X= 1−εc ; daí, por (3.13) e (3.16a), para Y= 0 e para X= 1−ε2c = a ou X= 1−ε2c = −a.
Aplicando a definição das cônicas para cada um dos dois pares foco–diretriz, tendo
−εp
+εp
em vista as coordenadas dos focos e que X está compreendido entre 1−ε2c = −a e 1−ε2c = a
(inclusive), obtemos6
. para o foco F:
s
"
ε2 pc
1 − ε2
#2
ε2 pc
X+
1 − ε2
#2
X−
+ Y2 = ε
p
c
−
X
;
1 − ε2
(3.22)
+ Y2 = ε
p
c
+
X
.
1 − ε2
(3.23)
. para o foco F0 :
s
"
εp
εp
Isto é, r = 1+ε ; θ = 0 [periélio para F] ; ou ainda, r = 1−ε ; θ = π [afélio para F].
Observe-se que no segundo membro de (3.22) temos a distância do ponto até a respectiva diretriz,
enquanto no primeiro membro temos a distância do ponto ao respectivo foco.
5
6
•C •V •A •Ṕ •T •Ṕ. 242 •Ú •S
Temos, assim, duas equações diferentes para a mesma elipse, das quais tiramos que a
soma das distâncias do ponto da elipse aos focos7 é constante e igual a 2a. Dessa forma,
obtermos uma definição alternativa para a elipse é a seguinte:
A elipse é uma curva plana cuja soma das distâncias do ponto da curva a
dois pontos fixos (os focos) é constante.
De (3.19), vê-se que o par de pontos (X= a, Y= 0) e (X= −a, Y= 0) estão sobre o eixo
de simetria OX, enquanto que o par de pontos (X= 0, Y= b) e (X= 0, Y= −b) estão sobre
o eixo de simetria OY. Tendo em vista que a > b, chamamos a de semi-eixo maior e b de
semi-eixo menor.
3.6.
Círculo
A cônica com excentricidade nula é o círculo. Esse caso precisa ser tratado com cuidado,
porque não é verdade (embora possa ficar parecendo à primeira vista) que εpc = 0,
quando ε = 0. Da equação (3.1), que define a excentricidade de uma cônica, dado o
foco e um ponto da cônica distando R desse foco, então o círculo fica definido quando
pc → ∞, uma vez que
lim ε = lim
pc →∞
7
pc →∞
R
=0
pc − R cos(θ)
O primeiro membros das equações (3.22) e (3.23).
•C •V •A •Ṕ •T •Ṕ. 243 •Ú •S
e
lim ε pc = R .
pc →∞
Dessa forma, a equação polar do círculo, com o foco na origem, é
r=R
∀θ ∈ R .
(3.24)
O círculo é, portanto, a cônica com excentricidade nula e diretriz infinitamente afastada
do foco. Sendo, pois, um caso limite da elipse, quando a distância entre os dois focos
tende a zero. Ver equação (3.21).
A própria equação polar, (3.24), leva-nos à seguinte definição alternativa:
O círculo é o lugar geométrico plano dos pontos eqüidistantes de um ponto.
Dessa forma, todo ponto do círculo é um apside em relação ao foco, e a sua equação
cartesiana, com origem no foco (centro do círculo) é imediata. De (3.24):
X2 + Y2 = R2 .
(3.25)
Observa-se que c = 0 e X= x.
3.7.
Parábola
Para a parábola ε = 1, e daí sua equação polar é
pc
r=
.
1 + cos(θ)
•C •V •A •Ṕ •T •Ṕ. 244 •Ú •S
Logo a parábola não pode ser uma curva fechada, pois, para θ → π, temos r → ∞.
O ponto para o qual r = pc /2 e θ = 0 é chamado vértice da parábola e é o periélio de
uma órbita parabólica, em relação ao foco F.
A equação cartesiana da parábola é, por (3.17a) ou por (3.17b)
Y2 = −2 pc X .
Uma parábola pode ser vista como caso limite de uma elipse quando a distância
entre os focos tende a ser infinita, isso pode ser tirado da equação (3.21), que dá a
distância entre os dois focos da elipse.
Observe-se que uma parábola é simétrica em relação ao eixo polar que adotamos. A
definição alternativa da parábola coincide com a definição geral das cônicas para ε = 1.
Da própria definição geral das cônicas e da de excentricidade chegamos trivialmente
à outra definição alternativa:
A parábola é a curva plana, lugar geométrico dos pontos cuja distância a um
ponto fixo (foco) é igual a sua distância a uma reta fixa (diretriz).
3.8.
Hipérbole
Como, para a hipérbole, ε > 1, r ≥ 0 e r é dado por (3.4), então, para θ em π2 , 3π
2 , teríamos
r ≤ 0, o que contrariaria o fato de r ≥ 0. Dessa forma, é fácil ver que a coordenada radial
não está definida para θ tal que 1+ε cos(θ) = 0, isto é, quando cos(θ) = −1/ε. Quando se
•C •V •A •Ṕ •T •Ṕ. 245 •Ú •S
considera o limite r → ∞, tem-se que θ → ± arccos( −1
ε ). Fazendo
α ≡ arccos
obtemos:
(
1
,
ε
tal que
π−α<θ<π+α
π + α < θ < 3π + α
0≤θ≤
π
,
2
⇒ r<0
⇒ r>0,
(3.26)
(3.27)
visto que a curva é simétrica em relação ao eixo polar adotado. Dessa forma a curva não
é limitada e, portanto, também não é fechada.
As equações para a hipérbole, de (3.4) e (3.18), são: equação polar
r=
ε pc
;
1 + ε cos(θ)
ε>1
(3.28)
e a equação cartesiana
"
ε2 − 1
ε pc
#2
X2 −
ε2 − 1 2
Y =1,
ε2 pc 2
denotando (da mesma forma como foi feito para a elipse):
ε pc
√
a ≡ ε2 − 1
,
tem-se:
b
=
a
ε2 − 1 .
ε
p
c
b
≡
√
ε2 − 1
(3.29)
(3.30)
•C •V •A •Ṕ •T •Ṕ. 246 •Ú •S
Assim, obtemos a forma cartesiana como a hipérbole é mais usualmente apresentada:
X 2 Y2
− 2 =1.
a2
b
(3.31)
Vê-se, portanto, que a curva é simétrica em relação aos eixos OX e OY (não confundir
com os eixos Ox e Oy). O foco F, localizado em x = 0 e y = 0, por (3.13) e (3.16a), será
localizado no sistema XOY por:
ε2 p c
X = − 2
ε −1
Y = 0 .
Ao foco F está associado a diretriz ∆ de equação: x = pc , ou em termos das coordenadas
XOY:
∆;
X = pc −
ε2 pc
ε2 − 1
⇒
X = −pc
∀Y ∈ R .
Pela simetria traduzida em (3.31), deve haver outro foco (F0 ) associado à hipérbole,
localizado em X= ε2 pc /(ε2 −1) e Y= 0, ao qual, por sua vez, está associada uma diretriz
de equação (em XOY):
∆0 ;
X = pc
∀Y ∈ R .
•C •V •A •Ṕ •T •Ṕ. 247 •Ú •S
A partir da definição geral das cônicas, nossa intenção agora é obter uma definição
mais usual da hipérbole, do que a aplicada para o sistema de coordenadas XOY.
Podemos escrever:
. para o foco F:
s
r
#2
"
pc 2
ε2 pc
+ Y2 = ε
X+ 2
X+ 2
;
ε −1
ε −1
s
r
"
#2
ε2 pc
pc 2
2
X− 2
X− 2
+Y =ε
,
ε −1
ε −1
. para o foco F0 :
então, denotando,
1. se X >
r
h
i
ε2 p 2
ξ ≡
X + ε2 −1c + Y2
r
h
i
ε2 p 2
0
X − ε2 −1c + Y2
ξ ≡
,
−pc
:
ε2 −1
ξ=ε X+
pc ε2 − 1
e
ξ0 = ε X −
pc ,
ε2 − 1
•C •V •A •Ṕ •T •Ṕ. 248 •Ú •S
de onde se tira:
pc
;
ε2 − 1
ξ − ξ0 = 2 ε
2. se X <
(3.32)
−pc
:
ε2 −1
ξ = −ε X +
pc ε2 − 1
ξ0 = −ε X −
e
de onde se tira:
ξ − ξ0 = −2 ε
pc ,
ε2 − 1
pc
.
−1
ε2
(3.33)
Portanto, vê-se que a diferença entre as distâncias do ponto da hipérbole aos focos é
uma constante, dessa forma, chegamos a outra definição alternativa:
A hipérbole é a curva plana, lugar geométrico dos pontos cuja diferença entre
as distâncias a dois pontos fixos é constante.
A definição geral das cônicas aplicada aos focos, F e F0 , da hipérbole leva às equações (3.32) e (3.33), as quais mostram que a hipérbole possui dois ramos, cada um deles
associados a um dos focos. Investigaremos agora o aspecto dos ramos da hipérbole por
meio da equação polar.
p
Como r = + x2 + y2 e x = r cos(θ), então (3.28) fica:
q
x2 + y2 = ε pc − x , para x > pc ,
(3.34)
•C •V •A •Ṕ •T •Ṕ. 249 •Ú •S
de forma que a hipérbole é o lugar geométrico dos pontos (x, y) tais que
2
x2 + y2 = ε2 pc − x .
Portanto, além de (3.34), a hipérbole também é satisfeita pelos pontos (x, y) tais que:
q
x2 + y2 = −ε pc − x ,
para x < pc ,
(3.35)
que traduz outro ramo da hipérbole8 .
A equação polar associada ao ramo descrito em (3.35) é
r=−
εpc
1 − ε cos(θ)
para ε > 0 e pc > 0 .
(3.36)
Como r > 0, então (3.36) é satisfeita apenas para ε > 1, portanto a equação polar das
cônicas descreve apenas ramos da curva que podem ser traçados continuamente!
Embora a excentricidade (ε) seja a razão entre dois comprimentos (portanto a excentricidade ε deve ser positiva), os dois ramos da hipérbole podem ser expressos de
modo unificado, na forma polar, se considerarmos ε0 = ε para o ramo dado por (3.34),
ao qual chamaremos de ramo positivo associado ao foco F, e ε0 = −ε para o ramo expresso
por (3.35), ao qual chamaremos ramo negativo associado ao foco F. Poderíamos chamar
ε0 de excentricidade relativa, uma vez que o seu valor relativo está associado ao foco da
8
Observe-se o domínio de x em (3.34) e em (3.35).
•C •V •A •Ṕ •T •Ṕ. 250 •Ú •S
hipérbole que se considera9 . Dessa forma, aferindo a excentricidade de um sinal, todos
os ramos da hipérbole ficam descritos por meio de uma expressão única:
r=
ε0 pc
.
1 − ε0 cos(θ)
(3.37)
O nosso objetivo mais imediato é descrever as partes de uma cônica que possam ser
traçadas continuamente, isto é, que possa apoiar a trajetória de uma partícula. Para o
caso da hipérbole, uma trajetória só pode ocorrer num dos dois ramos.
A classificação adotada para os ramos da hipérbole refere-se a um dos focos. Quanto
ao domínio do ângulo polar, em relação ao foco considerado, temos10 :
1. ε0 > 0 (ε0 = ε) ⇒ 1+ε cos(θ) > 0 ⇒ cos(θ) > −1/ε; logo11 ,
para o ramo positivo: π + α < θ < 3 π − α ;
(3.38)
2. ε0 < 0 (ε0 = −ε) ⇒ 1−ε cos(θ) < 0 ⇒ cos(θ) > 1/ε; logo,
para o ramo negativo:
− α < θ < +α .
(3.39)
Além disso, o periélio do ramo negativo está mais afastado do foco considerado do que
o periélio do ramo positivo, enquanto a diretriz associada a esse foco está entre esses
9
10
11
Em relação ao foco F0 os ramos trocam de classificação.
De (3.37) e (3.26).
Para α = arccos(1/ε).
•C •V •A •Ṕ •T •Ṕ. 251 •Ú •S
εp
dois periélios. Isso porque o primeiro está em θ = 0 e r = 1+εc , e o segundo em θ = 0 e
−ε p
r = 1−εc , e a diretriz passa por θ = 0 e r = pc .
Para o problema de Kepler 12 , o ramo negativo pode ser trajetória apenas de uma
partícula em um campo central repulsivo resultante (em relação ao foco considerado),
enquanto o ramo positivo pode ser trajetória apenas de uma partícula num campo atrativo (em relação ao foco considerado, onde está localizada a “fonte” do campo). O
valor relativo para a excentricidade da cônica mostra-se mais conveniente quando a
expressamos em função da energia mecânica (E) e do momentum angular (`):
K
ε0 = −
|K|
r
1+2
`2 E
.
mK2
(3.40)
12
Movimento de uma partícula num campo de força central inversamente proporcional ao quadrado da
distância.
•C •V •A •Ṕ •T •Ṕ. 252 •Ú •S
Capítulo 4
Coordenadas curvilíneas
O objetivo deste capítulo é o estudo das coordenadas curvilíneas e o seu uso na cinemática
e na dinâmica, enfim, de modo geral, na física.
Trataremos inicialmente do significado e dos critérios para que um determinado
conjunto de funções possa definir uma transformação entre sistemas de coordenadas,
o que será feito para o caso geral no R3 ; em seguida, veremos como essas coordenadas
curvilíneas podem ser usadas para tratar com vetores aplicados (vetores localizados).
Ficaremos restritos às chamadas coordenadas curvilíneas ortogonais, para as quais tiraremos as expressões da velocidade e da aceleração. Finalizaremos definindo gradiente,
•C •V •A •Ṕ •T •Ṕ. 253 •Ú •S
divergente e rotacional em coordenadas curvilíneas ortogonais1 .
As coordenadas curvilíneas são de grande utilidade em toda a física2 . Uma das
grandes vantagens do seu emprego está no fato das equações (diferenciais, integrais ou
integro-diferenciais) associadas a um sistema físico aparecerem com uma forma muito
mais simples quando expressas em termos de coordenadas curvilíneas apropriadas3 .
Em muitos casos, uma análise das simetrias que ocorrem no sistema leva a um critério
que pode indicar qual o sistema de coordenadas curvilíneas mais conveniente.
Embora pareça ser mais difícil equacionar um sistema em termos dessas coordenadas, de modo geral, será muito mais simples resolver as equações para o sistema
quando expressas por meio de coordenadas curvilíneas convenientemente escolhidas,
uma vez comparadas com as equações que somos levados a resolver ao adotamos um
sistema de coordenadas cartesianas (que, em primeira vista, é mais simples para o
equacionamento do sistema). Isso fica mais claro quando se passa a estudar alguns
campos com simetrias bem definidas, como é o caso do campo central.
Apesar da falta de uma motivação mais contundente, podemos dar um exemplo
para o estudante que se inicia no uso de sistemas de coordenadas que não sejam
cartesianos. Você certamente já deve ter usado coordenadas polares. Pois bem, elas são
1 Que são de grande valia para o estudo do trabalho de uma força, ou de forma mais geral, do trabalho
num campo de forças, quando se introduz o conceito de energia potencial para o caso de forças no espaço
tridimensional.
2 Embora possa parecer ao iniciante que é apenas “um troço complicado que ‘algum chato’ resolveu fazer
e ‘outro cara’, muito mais chato ainda, resolveu dar em aula e que, por pura maldade, cobrará em alguma
prova macabra”, não é bem isso...
3 Nem sempre sendo por meio de coordenadas cartesianas.
•C •V •A •Ṕ •T •Ṕ. 254 •Ú •S
um caso de coordenadas curvilíneas. Agora imagine uma partícula cuja trajetória, em
relação a um determinado referencial, seja circular (portanto a trajetória será plana). Se,
no plano do movimento, adotarmos um sistema de coordenadas polares com origem
no centro do círculo, então bastará que se informe o ângulo polar para que se localize a
posição da partícula sobre o círculo, uma vez que a coordenada radial polar é sempre
constante para o círculo com centro na origem. O trato do movimento fica muito
mais fácil, não é? Por outro lado, considere um sistema de coordenadas cartesiano,
com origem no centro do círculo, tão confortável de se trabalhar... As coordenadas
cartesianas (x, y) das diferentes posições da partícula sobre o círculo são necessárias
para a sua localização, nenhuma dessas duas coordenadas é constante e, além do
mais, elas estão relacionadas pela própria equação do círculo: x2 + y2 = r2 , algo muito
desconfortável para se tratar de ponto para ponto sobre o círculo.
4.1.
Sistema de coordenadas curvilíneas
Um sistema de coordenadas para localização de pontos no R3 está sempre relacionado
com a interseção de lugares geométricos 4 . É claro que isso também ocorre quando
usamos coordenadas cartesianas (x, y, z). Vejamos. A coordenada x define um plano
paralelo ao plano yOz, que corta o eixo Ox na cota x; as coordenadas x e y definem a
reta interseção dos planos x constante e y constante; enquanto a terna (x, y, z) fornece o
4 Ver relação de equivalência e classes de equivalência em §1.1. Note-se que nesse caso não estão incluídas
as chamadas quase-coordenadas, como, por exemplo, os ângulos de Euler (ver [35, pág. 42]).
•C •V •A •Ṕ •T •Ṕ. 255 •Ú •S
ponto interseção dessa reta com o plano z constante. Por outro lado, uma reta paralela
ao eixo Ox é dada por y constante e z constante; uma reta paralela ao eixo Oy é dada por
x e z constantes e, finalmente, uma reta paralela ao eixo Oz é dada por x e y constantes.
Podemos ainda encarar o ponto associado com essa terna como sendo a interseção de
três planos. Conforme a conveniência, várias leituras podem ser adotadas.
Se ~r é o vetor posição de um ponto do R3 em relação a um determinado observador pontual, então sabemos que ~r = ~r (q), onde q é um parâmetro real definido num
determinado domínio aberto D1 ∈ R, define uma curva no R3 , além do que, d~r /dq
é um vetor tangente à curva no ponto considerado5 (localizado por ~r ), associado ao
respectivo valor do parâmetro q. O papel desse parâmetro é, além de descrever a curva
em si, dotá-la de uma orientação (sobre a própria curva)6 , que é dada pelo sentido do
deslocamento do ponto associado à função vetorial ~r (q) para quando q cresce (em uma
vizinhança de um ponto de D1 ). O sentido de d~r /dq é justamente o sentido da orientação local dado pelo parâmetro q. Deve-se notar que, ao se proceder a uma substituição
do parâmetro q por um parâmetro u = −q, ~r = ~r (u) descreve a mesma curva traçada
em sentido contrário por meio da nova parametrização; ou melhor, a substituição do
parâmetro q pelo parâmetro u = q0 −q traça a mesma curva a partir da posição ~r (q0 ) em
sentido oposto do traçado por ~r (q) até essa posição. A função vetorial ~r = ~r (q) é uma
maneira de representar-se vetorialmente as equações paramétricas da curva. Observa-se
ainda que um mesmo ponto da curva pode estar associado a dois valores distintos do
5
Veremos mais detalhadamente esse aspecto no §4.2.
Essa orientação pode não ser única, uma vez um trecho da curva pode ser descrito em ambos sentidos
para valores distintos do parâmetro q.
6
•C •V •A •Ṕ •T •Ṕ. 256 •Ú •S
parâmetro q; isso ocorre, por exemplo, quando a curva corta-se a si própria.
Acrescentemos um pouco de tempero à nossa argumentação. Se q1 e q2 são dois
parâmetros distintos tais que o par ordenado (q1 , q2 ) ∈ D2 , onde D2 é um determinado
domínio aberto contido em R2 , o que significa a função vetorial ~r =~r (q1 , q2 )? A resposta
pode ser obtida de uma forma bastante simples. Vejamos.
Fixemos um dos parâmetros, q1 = a por exemplo. Ao variarmos o outro parâmetro,
que figura será traçada no espaço? Sim, uma curva, para a qual o vetor
∂~r ∂q2 a,q2
é justamente o vetor tangente à curva q1 = a (constante) no ponto (a, q2 ) e no sentido
para o qual q2 cresce, afinal, fixando um dos parâmetros, ficamos diante da equação
paramétrica de uma curva, conforme visto anteriormente. A mesma argumentação
pode ser seguida fixando-se q2 . A conclusão é a seguinte: ~r = ~r (q1 , q2 ) deve descrever
uma superfície no R3 . Uma mesma superfície pode ser parametrizada por diversos
modos diferentes, como também ocorre com a parametrização de uma curva. É sempre
conveniente distinguir o “conjunto imagem de uma função associado a um dado subconjunto do seu domínio” do “seu contradomínio”. O que estamos chamando superfície
é justamente a imagem de D2 através de ~r (q1 , q2 ), o que pode ser denotado por ~r [D2 ]
contido no R3 . Para que
~r = ~r (q1 , q2 ) ;
(q1 , q2 ) ∈ D2
(4.1)
varra integralmente a superfície bidimensional (sem singularidades) imersa no R3 , o
vetor tangente à curva q1 = a não pode ser paralelo ao vetor tangente à curva q2 = b
•C •V •A •Ṕ •T •Ṕ. 257 •Ú •S
no ponto (a, b) ∈ D2 . Caso isso ocorra, as duas curvas estarão se tangenciando nesse
ponto e não poderemos tratar de alguma vizinhança bidimensional (sobre essa superfície)
do ponto (a, b) mediante os pares ordenados (q1 , q2 ) ∈ D2 , uma vez que nem todos os
pontos da superfície, vizinhos do ponto (a, b), poderão ser tratados (vasculhados ou
atingidos) a partir (a, b) usando-se D2 ; isto é, dados quaisquer reais dq1 e dq2 (porém
suficientemente pequenos), então os pontos
a + dq1 , b + dq2 ∈ D2 , vizinhos do ponto (a, b),
estariam todos sobre a reta que passa por esse ponto e possui a direção do vetor:
∂~r ∂~r =
,
∂q1 a,b
∂q2 a,b
ou seja, as duas famílias de curvas q2 = b e q1 = a levam a uma vizinhança unidimensional
do ponto localizado por ~r (a, b), imersa no R3 , e não a uma vizinhança bidimensional,
como se requer de uma superfície (bidimensional imersa no R3 ). Uma condição necessária e suficiente para que (no R3 ) os vetores tangentes a cada uma das famílias não
sejam paralelos é que o seu produto vetorial seja não-nulo em cada ponto do domínio
D2 dos parâmetros, i.e.:
∂~r ∂~r ×
, ~0
∀(q1 , q2 ) ∈ D2 .
(4.2)
∂q1 q1 ,q2
∂q2 q1 ,q2
•C •V •A •Ṕ •T •Ṕ. 258 •Ú •S
Assim, podemos dizer: dada uma superfície regular7 no R3 , duas famílias de curvas
sobre essa superfície, caracterizadas por uma parametrização dessa superfície, definem
um sistema de coordenadas sobre a superfície se, e somente se, a condição (4.2) for
satisfeita. Em contrapartida, para que (4.1) descreva uma superfície sem qualquer
degenerescência (como por exemplo um nó num laço de fita) uma condição necessária
e suficiente também é (4.2).
Consideremos agora uma terna de parâmetros (q1 , q2 , q3 ) definida em um domínio
aberto D3 , e uma função vetorial
~r = ~r (q1 , q2 , q3 ) ;
(q1 , q2 , q3 ) ∈ D3
(4.3)
Não é difícil entender que ~r [D3 ] deve ser uma região tridimensional no R3 , e o será,
de fato, se todos os seus pontos tiverem alguma vizinhança tridimensional (associado
ao aberto D3 , com volume não-nulo) nessa região. Dessa forma, algumas condições
devem ser satisfeitas. Passaremos a examiná-las a seguir, por duas formas equivalentes,
porém muito instrutivas.
Primeiramente, repetiremos uma argumentação já apresentada. O par de parâmetros q2 e q3 da terna (q1 , q2 , q3 ) pode rotular uma família de curvas que fica determinada
fornecendo-se (fixando-se) um ponto da curva e fazendo-se variar q1 ; obtém-se assim
uma (curva) “equi-{q2 , q3 }”, ou seja, uma curva–coordenada. Esse mesmo raciocínio pode
ser seguido considerando-se as famílias rotuladas pelos par de parâmetros {q1 , q2 } ou
7 Isto é, se ~
r [D2 ] for um subconjunto para o qual cada vizinhança dos pontos do domínio estiver associada
uma área diferente de zero.
•C •V •A •Ṕ •T •Ṕ. 259 •Ú •S
pelos par {q1 , q3 }, cada um desses pares rotula as curvas da respectiva família: “equi{q1 , q2 }” e “equi-{q1 , q3 }”.
Podemos proceder ainda a outra leitura alternativa para (4.3). Fixando-se um dos
três parâmetros (independentes), q3 por exemplo e sem qualquer perda de generalidade,
obtém-se uma superfície que pode ser analisada sob o ponto de vista da equação (4.1).
Isto é, sobre essa superfície, que chamaremos de “equi-q3 ”, podemos considerar duas
famílias distintas de curvas: as quais poderíamos chamar de “equi-{q1 , q3 }” e “equi{q2 , q3 }”. Em vista de (4.2), para cada uma das superfícies rotuladas por q3 , devemos
ter:
∂~r
∂~r
×
, ~0 ∀(q1 , q2 , q3 ) ∈ D3 .
∂q1 ∂q2
Além disso, a curva rotulada pelos parâmetros q1 e q2 – que, variando-se q3 , passa pela posição
não pode tangenciar a superfície rotulada por q3 que passa por esse ponto,
ou seja: os vetores ∂~r /∂q1 , ∂~r /∂q2 e ∂~r /∂q3 , associados ao ponto (q1 , q2 , q3 ), não podem
ser coplanares; caso contrário, esse ponto não teria uma vizinhança tridimensional (não
degenerada) na região. Uma condição necessária e suficiente para que isso ocorra é:
!
∂~r
∂~r
∂~r
×
·
, 0 ∀(q1 , q2 , q3 ) ∈ D3 .
(4.4)
∂q1 ∂q2 ∂q3
~r (q1 , q2 , q3 )–
Um outro modo equivalente de encarar (4.3) no R3 , mas muito mais geral porque
pode ser aplicado no Rn (independentemente de uma definição de produto vetorial),
é analisar (4.3) diretamente como equação paramétrica. Isto é, se estamos adotando
•C •V •A •Ṕ •T •Ṕ. 260 •Ú •S
inicialmente um sistema cartesiano de coordenadas8 , então (4.3) pode ser escrita na
seguinte forma explícita em termos dos componentes
~r = x(q1 , q1 , q3 )ı̂ + y(q1 , q1 , q3 ) ̂ + z(q1 , q1 , q3 ) k̂ ,
ou seja, (4.3) define um sistema de três funções a três variáveis (os parâmetros q1 , q2 e
q3 ):
x = f1 (q1 , q2 , q3 )
(4.5)
y = f2 (q1 , q2 , q3 )
z = f3 (q1 , q2 , q3 ) ,
de modo que:
1. cada terna ordenada (q1 , q2 , q3 ) ∈ D3 está associada a um único ponto de coordenadas cartesianas (x, y, z) no R3 ; e
2. não existe terna em D3 que não possua um ponto de R3 a ele associado.
Seja P o conjunto de pontos do R3 localizados pelo conjunto de vetores posição ~r [D3 ],
i.e., P =~r [D3 ]. Para que (4.3), ou (4.5), defina outro sistema de coordenada em P (alternativo ao cartesiano) é fundamental que o sistema – de funções – (4.5) seja inversível,
quando, então, a relação (4.3) estabelecerá uma bijeção entre D3 e P. Esse sistema será
8 Raciocínio idêntico pode ser seguindo em termos de outro sistema qualquer de coordenadas, estamos
exemplificando com o cartesiano porque o leitor iniciante geralmente está muito mais acostumado a raciocinar
em termos destas.
•C •V •A •Ṕ •T •Ṕ. 261 •Ú •S
inversível se, e somente se, qualquer ponto de P vizinho de (x, y, z) ∈ P puder ser tratado
a partir de uma terna (q1 , q2 , q3 ) ∈ D3 , relacionados por (4.5); por outras palavras, dado
(x, y, z) ∈ P e um ponto vizinho (x+dx, y+dy, z+dz) ∈ P, então para ~r =~r (q1 , q2 , q3 ) existem
dq1 , dq2 e dq3 tais que:
x + dx = f1 (q1 + dq1 , q2 + dq2 , q3 + dq3 )
y + dy = f2 (q1 + dq1 , q2 + dq2 , q3 + dq3 )
z + dz = f3 (q1 + dq1 , q2 + dq2 , q3 + dq3 ) ,
assim, diferenciando cada uma das funções do sistema (4.5), obtém-se um sistema linear
em dq1 , dq2 e dq3 :
∂x
∂x
∂x
dx =
dq1 +
dq2 +
dq3
∂q
∂q
∂q
1
2
3
∂y
∂y
∂y
dq1 +
dq2 +
dq3
dy =
∂q1
∂q2
∂q3
∂z
∂z
∂z
dz = ∂q dq1 + ∂q dq2 + ∂q dq3
1
2
3
que permite determinar, em princípio, a terna (dq1 , dq2 , dq3 ) em D3 associada com a
terna (dx, dy, dz) em P. Portanto, dados quaisquer dx, dy e dz, para que dq1 , dq2 e dq3
estejam bem definidos para cada ponto de P, devemos ter o determinante principal
do sistema linear acima não-nulo para todos os pontos de P. Essa é uma condição
necessária e suficiente para que todos os elementos de P possuam uma vizinhança
•C •V •A •Ṕ •T •Ṕ. 262 •Ú •S
tridimensional em P. Esse determinante, que denotamos por
∂x
∂x
∂x
∂q1 ∂q2 ∂q3
∂y
∂(x, y, z)
∂y
∂y
,
= det
∂q1 ∂q2 ∂q3
∂(q1 , q2 , q3 )
∂z
∂z
∂z
∂q1 ∂q2 ∂q3
é chamado jacobiano do sistema de funções (4.5), e a condição necessária e suficiente
para que esse sistema de funções defina uma transformação de coordenadas na região
P em R3 é que o jacobiano do sistema seja não-nulo em D3 :
∂(x, y, z)
,0
∂(q1 , q2 , q3 )
∀(q1 , q2 , q3 ) ∈ D3 .
Observe que, no R3 , (4.6) e (4.4) são equivalentes, ou seja
"
#
∂(x, y, z)
∂~r ∂~r ∂~r
=
,
,
,
∂(q1 ,q2 ,q3 )
∂q1 ∂q2 ∂q3
(4.6)
(4.7)
uma vez que o determinante de uma matriz quadrada é igual ao da sua transposta. Em
(4.7) estamos denotando o produto misto dos vetores ~a, ~b e ~b por
h
i
~a · ~b × ~c = ~a, ~b, ~c .
•C •V •A •Ṕ •T •Ṕ. 263 •Ú •S
O resultado em (4.6) é válido para qualquer número (finito) de coordenadas. Em
particular, quando se tem uma única coordenada, o jacobiano se reduz à derivada
ordinária. Note-se que uma função é injetiva apenas em regiões onde a derivada é
não-nula.
4.1.1.
Base local para o trato com vetores localizados
Quando se trabalha com coordenadas curvilíneas, é conveniente usar uma base vetorial diferente em cada ponto da região considerada (uma base local) que esteja (intimamente) associada com o sistema de coordenadas curvilíneas. É mais conveniente
que cada vetor dessa base local tenha a direção da reta tangente a uma das “curvas–
coordenadas” associadas ao sistema de coordenadas curvilíneas. Sabendo-se como
lidar com as coordenadas curvilíneas para a localização de pontos numa determinada
região no R3 , pode-se estudar a melhor base de vetores para tratar de vetores localizados
nesses pontos da região considerada, em face do sistema de coordenadas curvilíneas
adotado. Vamos supor que
~r (q1 , q2 , q3 ) = x(q1 , q2 , q3 )ı̂ + y(q1 , q2 , q3 ) ̂ + z(q1 , q2 , q3 ) k̂
(4.8)
e que (4.3) defina um sistema de coordenadas curvilíneas numa região P contida no R3 .
Dessa forma, os vetores ∂~r/∂q1 , ∂~r/∂q2 e ∂~r/∂q3 não são coplanares, ou seja, eles
são linearmente independentes e, daí, qualquer vetor localizado na posição ~r (q1 , q2 , q3 )
•C •V •A •Ṕ •T •Ṕ. 264 •Ú •S
pode ser escrito como combinação linear desses três vetores, sejam:
∂~r
~e1 (q1 , q2 , q3 ) ≡
∂q1
∂~r
∀(q1 , q2 , q3 ) ∈ D3 .
~e2 (q1 , q2 , q3 ) ≡
∂q
2
∂~r
~e3 (q1 , q2 , q3 ) ≡ ∂q
(4.9)
3
Como a norma de cada um desses vetores não é nula, é mais conveniente lidarmos com
a base normalizada (i.e., formada por vetores com norma igual a 1):
−1
∂~r ∂~r
ê
(q
,
q
,
q
)
≡
1 1 2 3
∂q1 ∂q1
−1
∂~r ∂~r
(4.10)
ê
(q
,
q
,
q
)
≡
2
1
2
3
∂q2 ∂q2
−1
∂~r ∂~r
ê3 (q1 , q2 , q3 ) ≡ ∂q3 ∂q3
ou, de modo mais sintético9 ,
−1
∂~r ∂~r
ê j ≡ ∂q j ∂q j
9
j ∈ I3 .
(4.11)
Na notação mais usual, deixamos implícita a dependência funcional com as coordenadas (q1 , q2 , q3 ).
•C •V •A •Ṕ •T •Ṕ. 265 •Ú •S
Dessa forma, em vista de (4.7),
"
#
∂(x, y, z)
∂~r ∂~r ∂~r
=
;
;
∂(q1 ,q2 ,q3 )
∂q1 ∂q2 ∂q3
∂~r ∂~r ∂~r [ê1 ; ê2 ; ê3 ] .
= ∂q1 ∂q2 ∂q3 (4.12)
Até este ponto, o nosso tratamento é absolutamente geral para o R3 ; porém, a
expressão (4.12) mostra que um caso particularmente interessante ocorre quando os
vetores da base local forem (dois a dois) ortogonais. Nessa situação o módulo do jacobiano
será igual ao produto das normas dos vetores em (4.9) e, além disso poderemos fazer uso
do produto escalar para a determinação das componentes dos vetores localizados10 .
Investigaremos esse caso.
Se os versores ê1 , ê2 e ê3 forem ortogonais, teremos
[ê1 ; ê2 ; ê3 ] = ±1
∀(q1 , q2 , q3 ) ∈ D3 ,
sendo igual a +1 quando ê1 , ê2 e ê3 , nessa ordem (cíclica), formarem um triedro direto.
De maneira geral, para coordenadas curvilíneas associadas às bases locais ortogonais,
temos que a condição
∂(x, y, z)
∂~r ∂~r ∂~r = ± ( , 0)
∂(q1 , q2 , q3 )
∂q1 ∂q2 ∂q3 10
Quando os vetores da base não são ortogonais é necessário considerar a base recíproca.
•C •V •A •Ṕ •T •Ṕ. 266 •Ú •S
garante (como uma condição necessária e suficiente) que a transformação de coordenadas seja ortogonal, isto é: as curvas11 que mapeiam o espaço interceptam-se perpendicularmente, duas a duas, em cada pondo do espaço. Nesse caso diremos que as
coordenadas são ortogonais.
Consideraremos agora uma grandeza vetorial que dependa apenas da posição, di~ = G(~
~ r ). Em termos das coordenadas (q1 , q2 , q3 ), que estaremos considerando
gamos G
como sendo coordenadas curvilíneas ortonormais, e tendo em vista a base ortonormal
~
definida em (4.11), podemos escrever para cada posição ~r do domínio da função G:
~ r) =
G(~
3 X
~ · êi êi .
G
(4.13)
i=1
Quando usamos as coordenadas curvilíneas (q1 , q2 , q3 ), podemos expressar essa grandeza em termos dessas coordenadas através de uma função explicita dessas coordenadas, digamos
~ (~r (q1 , q2 , q3 ))
~ 1 , q2 , q3 ) = G
B(q
(4.14)
~ r ) na representação (q1 , q2 , q3 ). Como é de hábito, quando não
que denota a função G(~
~ e B,
~ deixando o argumento
houver confusão, não faremos distinção entre as funções G
subentendido; de qualquer forma, é sempre interessante estar em condições de discriminar qual função que se está usando.
11
q1 = cte e q2 = cte ; q1 = cte e q3 = cte ; q2 = cte e q3 = cte .
•C •V •A •Ṕ •T •Ṕ. 267 •Ú •S
No próximo parágrafo, analisaremos como é possível expressar as principais grandezas cinemáticas em termos da base local (normalizada) associada a um sistema e
coordenadas curvilíneas ortogonais.
4.1.2.
As componentes dos vetores posição, velocidade e aceleração
em coordenadas curvilíneas ortogonais
~ (~r ), é sempre possível considerar, em
Dada uma trajetória ~r (t) e uma função vetorial G
cada instante t, a função vetorial composta:
~ r (t)) .
~Γ(t) =G(~
(4.15)
Dessa forma12 , é possível expressar a derivada temporal da função Γ [ou, relaxando
~ ] em termos da base local
um pouco a terminologia, a derivada temporal da função G
associada com as coordenadas curvilíneas ortogonais (q1 , q2 , q3 ). Agora ocorre uma diferença substancial em relação ao que ocorre quando se faz uso apenas de coordenadas
cartesianas, quando a base (ı̂, ̂, k̂) é considerada tomando-se uma réplica em cada
posição do espaço. As bases locais (ê1 , ê2 , ê3 ), associadas às coordenadas curvilíneas,
podem ser diferentes de um ponto para outro ponto. Assim, qualquer mudança de
posição pode acarretar um incremento (ou variação) de cada uma das funções vetoriais
êi (~r ). Usando (4.13) e (4.14), temos:
~ r (t)) em consonância com a cronologia da
Observa-se que a função ~Γ(t) traduz a cronologia da função G(~
trajetória ~r (t), descrita através do parâmetro t.
12
•C •V •A •Ṕ •T •Ṕ. 268 •Ú •S
d~Γ d ~
d ~
=
G(~r (t)) =
G(~r (q1 (t), q2 (t), q3 (t)))
dt
dt
dt
3
o
d X n~
=
G(~r (q1 (t), q2 (t), q3 (t))) · êi êi
dt
i=1
3 ~
3 X
X
dêi
∂G dq j
d
ê
i
~·
~ · êi
· êi êi + G
ê
+
G
=
i
dt
dt
dt
∂q
j
i=1 j=1
3 ~
3
X
dêi
dq j
dêi
X ∂G
~
~
=
ê
+
G
·
ê
·
ê
+
G
·
.
i
i
i
∂q dt
dt
dt
j
i=1
(4.16)
j=1
Se mantivermos a representação por meio das coordenadas antigas, as derivadas indicadas na última igualdade não devem trazer nenhuma nova dificuldade (comparando-se
com o que ocorre no caso das coordenadas cartesianas). Além disso, até os vetores da
própria base local podem (e devem) ser tratados dessa mesma forma para a determinação de sua derivada temporal (induzida pela trajetória considerada). A novidade
neste parágrafo será a determinação da sua representação em termos da própria base
local (associada ao novo sistema de coordenadas). Não perca de vista que: desde que
se conheçam as componentes de um vetor numa base, o vetor está conhecido (podendo
ser expresso também em termos de qualquer outra base). O embaraço inicial é perceber
que, numa mudança de sistema de coordenadas ou numa mudança de base, devemos
saber expressar todas as grandezas em ambos sistemas de coordenadas ou em ambas
•C •V •A •Ṕ •T •Ṕ. 269 •Ú •S
as bases. Vejamos como abordar os versores da base.
Consideremos que (4.8) defina um sistema de coordenadas curvilíneas ortogonais
(q1 , q2 , q3 ) e que o sistema (4.10) determina as bases ortonormais locais, então, usando
a notação (4.11),
−1
)
∂~r d ∂~r
d ∂~r ∂~r − 12 ∂~r
=
·
+
dt
dt ∂q j ∂q j
∂q j ∂q j dt ∂q j
−1
(
)
∂~r ∂~r − 32 ∂~r d ∂~r
∂~r d ∂~r
∂~r
1
= −2 2
·
·
+
∂q j ∂q j
∂q j dt ∂q j ∂q j ∂q j dt ∂q j
−1 −2
!
∂~r
∂~r
∂~
r
d
∂~
r
∂~
r
d
∂~
r
−
=
·
+
.
∂q j ∂q j
∂q j dt ∂q j ∂q j dt ∂q j
dê j
(
Uma vez determinada essa expressão, ainda em termos da base local associada ao
sistema de coordenadas anterior, é possível transformá-la em outra relação expressa
inteiramente em termos das novas coordenadas [ortogonais] (q1 , q2 , q3 ) e da base local
[ortonormal] associada com essas novas coordenadas. Basta que lancemos mão do
~(t) é tal que
produto escalar13 e da proposição que garante que, se a função vetorial u
~(t) e d~
|~
u(t)| é constante (em relação a t), então os vetores u
u(t)/dt são ortogonais14 , ou
13 Essa é a grande vantagem que ocorre quando é possível o uso de coordenadas ortogonais: a possibilidade
do uso do produto escalar.
14 Se |~
u(t)| é constante, então d{~
u(t)·~
u(t)}/dt = 0, uma vez que 2~
u·(d~
u/dt) = 0.
•C •V •A •Ṕ •T •Ṕ. 270 •Ú •S
seja, basta calcularmos os produtos escalares15 :
dê j
dt
· êk
para
k ∈ {1, 2, 3}−{ j}
e proceder à mudança das coordenadas. Conhecida a expressão para a derivada de
cada vetor da nova base local, é possível determinar as derivadas de ordem superior.
~ r ) = ~r , obtém-se [por (4.16)] a expressão para a velocidade
Quando se considera G(~
nas novas coordenadas (e na nova base local associada a essas coordenadas); quando
~ r ) = d~r /dt, obtém-se a aceleração, assim por diante.
G(~
Nossa intenção não é obter uma expressão geral para as derivadas das funções
vetoriais, pretendemos obter apenas um modo geral de como tratá-las e obtê-las. O
entendimento do exposto anteriormente fica facilitado com um exemplo. Mas, antes
de qualquer exemplificação, um pequeno roteiro geral:
1. escrever a transformação de coordenadas (x, y, z) 7→ (q1 , q2 , q3 ) em termos das funções consideradas;
2. determinar ~r em termos das novas coordenadas e da base local16 ;
3. determinar os versores êi ;
Uma vez que, quando k = j, o produto escalar será sempre igual a zero.
Observe-se que a base local é considerada na posição que o vetor posição localiza, e não na posição do
observador (da origem ou do pólo).
15
16
•C •V •A •Ṕ •T •Ṕ. 271 •Ú •S
4. determinar as derivadas dêi /dt dos versores êi ;
5. substituir essas grandezas locais nos vetores localizados a serem considerados.
4.1.3.
Coordenadas cilíndricas
Seja a transformação do sistema cartesiano de coordenadas para o sistema de coordenadas
cilíndricas:
x = ρ cos(φ)
(4.17)
y = ρ sen(φ)
z = z
O vetor posição será expresso na forma:
~r = x ı̂ + y ̂ + z k̂ = ρ cos(φ) ı̂ + ρ cos(φ) ̂ + z k̂
(4.18)
Portanto:
•C •V •A •Ṕ •T •Ṕ. 272 •Ú •S
∂~r
~ =
= cos(φ) ı̂ + sen(φ) ̂
⇒
ρ
∂ρ
ρ̂ = cos(φ) ı̂ + sen(φ) ̂ = êρ
∂~r
φ
~ = ∂φ = −ρ sen(φ) ı̂ + ρ cos(φ) ̂
φ̂ = − sen(φ) ı̂ + cos(φ) ̂ = ê
φ
∂~r
~z =
= k̂
⇒
|~
z | = 1 , daí
∂z
ẑ = k̂ = ê .
|~
ρ | = 1 , daí
⇒
~ | = ρ , daí
|φ
z
Assim é possível tirar:
~r = ~r · êρ ρ̂ + ~r · êφ φ̂ + ~r · êz ẑ .
Dessa forma, o vetor posição em coordenadas cilíndricas é:
~r = ρ êρ + z êz .
(4.19)
•C •V •A •Ṕ •T •Ṕ. 273 •Ú •S
Além disso,
∂êρ
∂ρ
∂êφ
=0
=0
∂ρ
∂êz
=0
∂ρ
∂êρ
∂φ
∂êφ
= +êφ
= −êρ
∂φ
∂êz
=0
∂φ
∂êρ
∂z
∂êφ
=0
=0
∂z
∂êz
=0.
∂z
Portanto, para as derivadas dos versores da base, temos:
ê˙ρ = −φ̇ sen(φ) ı̂ + φ̇ cos(φ) ̂
˙
⇒
êφ = −φ̇ cos(φ) ı̂ − φ̇ sen(φ) ̂
ê˙z = ~0
ê˙ρ = +φ̇ êφ
˙
êφ = −φ̇ êρ
ê˙z = ~0 .
(4.20)
(4.21)
Então podemos tirar a expressão para a velocidade em coordenadas cilíndricas:
d~r
= ρ̇ êρ + ż êz + ρ ê˙ρ ,
dt
~
v = ρ̇ êρ + ρ φ̇ êφ + ż êz
~
v=
daí
(4.22)
e, em seguida a expressão para a aceleração em coordenadas cilíndricas:
•C •V •A •Ṕ •T •Ṕ. 274 •Ú •S
d~
v
dt
= ρ̈ êρ + ρ̇ φ̇ + ρ φ̈ φ̂ + z̈ êz + ρ̇ ê˙ρ + φ φ̇ ê˙φ
= ρ̈ êρ + ρ̇ φ̇ + ρ φ̈ φ̂ + z̈ êz + ρ̇ φ̇ êφ − φ φ̇2 êρ , daí
~a = ρ̈ − ρ φ̇2 êρ + ρ φ̈ + 2 ρ̇ φ̇ êφ + z̈ êz .
~a =
(4.23)
Problema 4.1. Como uma forma alternativa do procedimento que seguimos anteriormente, obtenha os vetores posição, velocidade e aceleração em coordenadas cilíndricas
exprimindo os vetores da base (ı̂, ̂, k̂) em termos da base local associada às coordenadas
cilíndricas.
4.1.4.
Coordenadas esféricas
Em função das coordenadas cartesianas, o sistema de coordenadas esféricas (r, θ, φ)
pode ser definido pelo sistema de funções:
x = r cos(φ) sen(θ)
(4.24)
y = r sen(φ) sen(θ)
z = r cos(θ) .
Deixaremos como problema a determinação das grandezas cinemáticas em termos das
coordenadas esféricas (é muito importante que o estudante o resolva). Como forma al•C •V •A •Ṕ •T •Ṕ. 275 •Ú •S
ternativa, que julgo muito instrutivo, apresentarei essas expressões obtidas diretamente
da transformação das coordenadas cilíndricas para as coordenadas esféricas.
Comparando (4.17) com (4.24) podemos escrever a lei que transforma diretamente
das coordenadas cilíndricas (ρ, φ, z) para as coordenadas esféricas (r, θ, φ):
ρ = r sen(θ)
(ρ, φ, z) 7→ (r, θ, φ) ;
(4.25)
z = r sen(θ)
φ = φ .
Da expressão do vetor posição em coordenadas cilíndricas (4.18):
~r = ρ ρ̂ + z k̂
e de (4.24), tiramos:
~r = r sen(θ) ρ̂ + r cos(θ) k̂ .
Assim, estamos aptos para determinar a base local associada às coordenadas esféricas17 :
∂~r
= sen(θ) ρ̂ + cos(θ) k̂
∂r
ê1 = r̂ = sen(θ) ρ̂ + cos(θ) k̂
∂~r
= r cos(θ) ρ̂ − sen(θ) k̂
⇒
ê2 = θ̂ = cos(θ) ρ̂ − sen(θ) k̂
∂θ
ê3 = φ̂ .
∂ρ̂
∂~
r
= r sen(θ)
= r sen(θ) φ̂
∂φ
∂φ
17
Estaremos usando (4.20).
•C •V •A •Ṕ •T •Ṕ. 276 •Ú •S
Podemos assim obter o vetor posição em coordenadas esféricas:
~r = ~r · r̂ r̂ + ~r · θ̂ θ̂ + ~r · φ̂ φ̂
= r sen2 (θ) + r cos2 (θ) r̂ + 0 θ̂ + 0 φ̂
~r = r r̂ .
(4.26)
As derivadas dos vetores da base local (ortonormal) associadas às coordenadas esféricas, em termos destas, são:
∂r̂
∂r̂
∂r̂
=0
= θ̂
= sen(θ) φ̂
∂r
∂θ
∂φ
∂θ̂
∂θ̂
∂θ̂ = 0
= −r̂
= cos(θ) φ̂
(4.27)
∂r
∂θ
∂φ
∂φ̂
∂φ̂
∂φ̂
=0
= −ρ̂
∂r = 0
∂θ
∂φ
Para a velocidade em coordenadas esféricas:
~
v = ~r˙
= ṙ r̂ + r r̂˙
= ṙ r̂ + r θ̇ θ̂ + φ̇ sen(φ) φ̂ , daí
~
v = ṙ r̂ + r θ̇ θ̂ + r φ̇ sen(θ) φ̂
(4.28)
•C •V •A •Ṕ •T •Ṕ. 277 •Ú •S
Para a aceleração:
~a = ~
v˙ =
= r̈ r̂ + 2ṙ θ̇ θ̂ + φ̇ sen(θ) φ̂ + r θ̈ θ̂ + φ̈ sen(θ) φ̂ + φ̇ θ̇ cos(θ) φ̂ +
+ r θ̇ − θ̇ r̂ + φ̇ cos(θ) φ̂ − r φ̇2 sen(θ) sen(θ) r̂ + cos(θ) θ̂ ,
portanto
i
h
~a = r̈ − r θ̇2 − r φ̇2 sen2 (θ) r̂+
h
i
+ r θ̈ + 2 ṙ θ̇ − r φ̇2 sen(θ) cos(θ) θ̂+
h
i
+ r φ̈ sen(θ) + 2 ṙ φ̇ sen(θ) + 2 r φ̇ θ̇ cos(θ) φ̂ .
(4.29)
v·~
v;
Problema 4.2. Considere a energia cinética de uma partícula de massa m, T = 12 m~
expresse-a:
1. em termos das coordenadas cilíndricas e
2. em termos das coordenadas esféricas.
Problema 4.3. Considere as coordenadas curvilíneas parabólicas no plano:
1
2
2
x1 = 2 q1 − q2
x2 = q1 · q2
•C •V •A •Ṕ •T •Ṕ. 278 •Ú •S
Determine: a transformação inversa, e, em termos da base local associada às coordenadas (q1 , q2 ), os vetores posição, velocidade18 e aceleração. Determine também a energia
cinética de uma partícula de massa m em função das coordenadas q1 e q2 .
4.2.
Triedro e fórmulas de Frenet
Dado um movimento ~r (t) de uma partícula, parece-nos bastante espontâneo, após o
estudo das coordenadas curvilíneas, investigar a base ortonormal [local associada a
cada ponto situado ao longo de ~r (t)] mais adequada à própria trajetória do movimento
em questão. Essa base (ortonormal) local é conhecida como triedro de Frenet19 e as
relações entre os triedros de Frenet e as derivadas associadas com as trajetórias são
conhecidas por fórmulas de Frenet.
É muito natural que o primeiro vetor proposto para essa base local seja o versor na direção da reta tangente à trajetória no instante considerado, ou na posição considerada20 ,
18
19
20
1
ê1 = α(q1 ı̂+q2 ̂) e ê2 = α(−q2 ı̂+q1 ̂), onde α = (q21 +q22 )− 2 .
q
n
o
1
2
2
~r = 2 q1 +q2 q1 ê1 +q2 ê2
q
n
o
~
v = q21 +q22 q̇1 ê1 + q̇2 ê2 .
Leitura recomendada: [16], [14], [13], [31], [8], [4], [26], [22].
No caso da curva associada à trajetória não se cortar a si própria.
•C •V •A •Ṕ •T •Ṕ. 279 •Ú •S
e com o sentido associado ao crescimento do parâmetro t. Afinal, esse é um vetor imediatamente determinado a partir da trajetória ~r (t).
4.2.1.
Conceituação de reta tangente a uma curva
Antes de prosseguirmos, é conveniente “refrescar o conceito” de reta tangente a uma
curva. Não é raro ouvirmos dizer que “tangente a uma curva é a reta que corta a curva
num único ponto”. Mas muito cuidado, este jargão não está correto, uma vez que não
consegue definir o que propõe. Se você não está percebendo o erro, imagine uma curva
aberta e uma reta qualquer que a corte num único ponto; varie um pouco essa reta e
veja se não continua tocando num único ponto... Um outro exemplo: considere uma
circunferência γ em um plano π e várias retas que não estejam em π e que interceptam
a circunferência num mesmo ponto, elas serão tangente a γ nesse ponto? Bem, deve
estar claro que o conceito de reta tangente está relacionado ao de limite. Vejamos.
Seja uma curva γ qualquer no R3 e um ponto P ∈ γ, seja ainda A ∈ γ outro ponto da
curva e a reta secante definida por esses dois pontos. Se existe uma a reta secante limite
para quando o ponto A tende ao ponto P (i.e., A → P), essa reta limite é chamada reta
tangente à curva γ no ponto P.
Um vetor tangente à curva ~r (t) estará definido quando a velocidade associada ao
•C •V •A •Ṕ •T •Ṕ. 280 •Ú •S
instante t for não-nula ou se a derivada d~r/ds for não-nula21 , uma vez que
~
v=
d~r d~r ds
=
,
dt
ds dt
onde s é o comprimento de arco associado à curva na vizinhança do instante considerado.
Como ~
v = d~
v/dt (ou d~r/ds) é tangente à trajetória, então, se a velocidade (ou d~r/ds) for
não-nula, podemos definir o versor tangente à curva:
−1
d~r d~r
.
(4.30)
T̂ ≡ dt
dt
O vetor velocidade pode então ser expresso em termos do versor T̂:
d~r d~r ~
v≡
= T̂ .
dt
dt
Convém investigar a norma da velocidade, fazendo uso de um sistema cartesiano de coordenadas (afinal, a norma de um vetor não pode depender do sistema de coordenadas
curvilíneas do qual se faça uso no referencial considerado):
s
!2 2
2
dy
dx
dz
d~r d~r =
+
+
⇒
dt dt dt = ds ,
dt
dt
dt
Pode ocorrer d~r/dt = ~0 e d~r/ds , ~0, essa é a grande vantagem de se parametrizar uma curva pelo
comprimento de arco.
21
•C •V •A •Ṕ •T •Ṕ. 281 •Ú •S
sendo ds > 0 o comprimento de um elemento infinitesimal de arco sobre a curva,
contendo o ponto considerado da curva. Portanto,
d~r ds
dt = dt = v ,
onde v denota a norma do vetor velocidade, sendo, portanto, igual ao módulo da velocidade escalar quando se adota sobre a trajetória uma escala de comprimento de arco,
como é usual. Resumindo:
−1
d~r d~r d~r
=
,
T̂ ≡ dt
dt
ds
ds
~
v=
T̂ = v T̂ .
dt
Tendo em vista que T̂ está normalizado, ou seja, como T̂(t) e T̂(s) possuem (ao longo dos
pontos regulares da trajetória22 ) norma constante igual a um, então dT̂/dt ⊥ T̂, assim
podemos obter um segundo vetor de uma base ortonormal. Em particular, a aceleração
pode ser expressa por:
d~
v dv
dT̂
~a =
=
T̂ + v
,
dt
dt
dt
22 Parametrizar uma curva pelo comprimento de arco apresenta grande vantagem quando a velocidade
for nula num ponto regular da curva, isto é, num ponto da curva que possui tangente bem definida.
•C •V •A •Ṕ •T •Ṕ. 282 •Ú •S
porém
dT̂ dT̂ ds
dT̂
=
=v
.
dt
ds dt
ds
Definindo:
dT̂ K ≡ ds
1
R≡
K
1 dT̂
N̂ ≡
K ds
(4.31)
(4.32)
(4.33)
como sendo, respectivamente: a curvatura, o raio de curvatura e o vetor normal (normalizado) no ponto considerado da curva. Então
dT̂
= v K N̂ ,
dt
daí,
onde
~a = aT T̂ + aN N̂ ,
(4.34)
dv
aT = ~a · T̂ = dt ,
v2
aN = ~a · N̂ =
.
R
•C •V •A •Ṕ •T •Ṕ. 283 •Ú •S
É conveniente interpretar geometricamente a curvatura e o raio de curvatura, definidos
em (4.31)–(4.33), que justificará os respectivos nomes. Tem-se:
1. no caso do movimento ser retilíneo, ocorre que K = 0, portanto a direção de N̂ está
indeterminada a partir de T̂; quando K → 0, então R → ∞ e N̂ → ~0 (o vetor nulo);
2. se K , 0, podemos considerar o ângulo elementar dα definido pelas direções de T̂
e de T̂+dT̂ (Fig. 4.123 ); nesse caso, como ds e dα são não-nulos, existe um real λ
tal que ds = λdα, do que se segue:
1 dT̂
dT̂ dT̂ dα
=
=
.
ds
dα ds
λ dα
Afirmamos que (se K , 0): |dT̂/dα| = 1. Com efeito, como estamos interessados no limite
para ∆α → 0, podemos tomar os termos de primeira ordem em ∆α. Nesse caso, do
triângulo que tem como lados os segmentos definidos pelos versores T̂ em P e em A
∆α
(que definem o ângulo ∆α) e pelo vetor ∆T̂, tiramos: |∆T̂| = 12 |T̂| sen( ∆α
2 ), pois cos( 2 ) é,
para ∆α pequeno, aproximadamente
igual a 1 (ver §2.11, pág. 192). Logo, a menos de
infinitésimos de ordem superior: ∆T̂ = T̂ sen(∆α) . Uma vez que ds = λdα, podemos
interpretar geometricamente λ = R como sendo o raio do círculo limite, definido por
três pontos sobre a curva – dos quais, um é localizado pelo próprio ~r (t) para o valor
23 Levando em conta que dT̂ é o incremento do versor tangente em P quando se desloca para um ponto A
próximo de P; nesse caso dα é o ângulo entre as retas tangentes em A e em P, e ds é o comprimento de arco
PA sobre a curva, sempre para pontos P e A suficientemente próximos.
•C •V •A •Ṕ •T •Ṕ. 284 •Ú •S
B
A
P
D
C
Figura 4.1:
No ponto P estão indicados: o versor tangente à curva em P, uma réplica do versor tangente
à curva em A, além do incremento ∆T̂; o ponto C é o centro de curvatura associado ao ponto P e o ponto D
é centro do círculo que passa pelos pontos P, A e B; o ângulo ∆α, referido no texto, é definido pelas retas
tangentes em P e em A (observe-se que D → C quando B → P)
•C •V •A •Ṕ •T •Ṕ. 285 •Ú •S
do parâmetro considerado – quando a distância entre esses pontos tende a zero (dados
três pontos, existe um único arco de circunferência de círculo que os contêm; observe que
a interseção das mediatrizes de dois pares dos três pontos determina o centro desse círculo).
O plano que contém o ponto considerado é paralelo, nesse ponto, a T̂ e a N̂, sendo
chamado plano osculador. Portanto, a aceleração é um vetor paralelo ao plano osculador
e pode ser escrita, em termos dos versores T̂ e N̂, como em (4.34)
dv
aT =
= ~a · T̂ ,
dt
v2
~a = aT T̂ + aN N̂ , onde
= ~a · N̂ ,
a
=
N
R
1
R = .
K
Não dispomos ainda de uma base para tratar com um vetor qualquer localizado
num dado ponto de uma trajetória no espaço físico (a três dimensões). Por enquanto,
dispondo apenas dos vetores T̂ e N̂, sabemos tratar somente com vetores no plano
osculador à curva no ponto considerado. Um terceiro vetor linearmente independente
(a esses dois versores) pode ser obtido naturalmente mediante o produto vetorial T̂×N̂,
que terá norma igual a 1, uma vez que T̂ e N̂ são versores ortogonais, seja
B̂ ≡ T̂ × N̂ .
(4.35)
Os versores T̂, N̂ e B̂ formam, pois, nessa ordem, uma base ortonormal direta. O versor
B̂ é chamado de binormal à curva no ponto considerado. Já sabemos analisar em termos
•C •V •A •Ṕ •T •Ṕ. 286 •Ú •S
da base de Frenet os vetores aplicados num determinado ponto de uma curva dada,
veremos como tratar situações ao longo de uma curva.
4.2.2.
Função vetorial e suas derivadas em uma
base de Frenet
~ = A(t)
~ qualquer, associada ao ponto de vetor posição ~r (t) no
Uma função vetorial A
instante t, terá componentes, na base de Frenet (ou, em termos do triedro de Frenet, como
essa base normalmente é referida na literatura):
~ = A1 (t) T̂(t) + A2 (t) N̂(t) + A3 (t) B̂(t) ,
A(t)
onde
(4.36)
~ · T̂(t)
A = A(t)
1
~ · N̂(t)
A2 = A(t)
A3 = A(t)
~ · B̂(t)
e T̂, N̂ e B̂ estão definidos por ~r (t) para cada valor do parâmetro t. A fim de determinar
as derivadas em função do parâmetro t, devemos conhecer, além de dT̂/ds (que já
conhecemos), os vetores dN̂/ds e dB̂/ds, os quais estão mais intimamente relacionados
com a curva do que com a trajetória em si. Para determinar esses vetores dispomos das
seguintes relações: [de (4.30) e (4.31)–(4.33)]
−1
d~r
d~r d~r
T̂ ≡ =
dt
dt
ds
•C •V •A •Ṕ •T •Ṕ. 287 •Ú •S
(~a · N̂) N̂ = ~a − (~a · T̂) T̂
−1
~
~
a
−
a
·
T̂
T̂
1 dT̂ dT̂ dT̂
N̂ ≡
= = K ds
dt
dt
~a − ~a · T̂ T̂
e ainda:
1. N̂ · T̂ = 0
dN̂
dT̂
· T̂ = −N̂ ·
= −K , daí
ds
ds
⇒
1
dN̂
· T̂ = − ;
ds
R
(4.37)
dN̂
dB̂
· B̂ = − N̂ ·
;
ds
ds
(4.38)
2. N̂ · B̂ = 0 , daí
3. B̂ ≡ T̂ × N̂ , daí
(
"
# )
dB̂
1
−1
dB̂
= N̂ × N̂ + T̂ ×
T̂ − N̂ ·
B̂ .
ds
λ
λ
ds
Portanto
"
#
dB̂
dB̂
= N̂ ·
N̂ ;
ds
ds
dB̂
· T̂ = 0
ds
e
dB̂
· B̂ = 0
ds
(4.39)
•C •V •A •Ṕ •T •Ṕ. 288 •Ú •S
Se a curva não for plana, definimos
dB̂ τ ≡ ds
e
h≡
1
;
τ
(4.40)
a grandeza τ é chamada torção e h é chamada raio de torção. Temos, então, de (4.31)–
(4.33) e de (4.37)–(4.40):
dT̂
1
= N̂
ds
R
dB̂ 1
(4.41)
= N̂
h
ds
−1
dN̂ −1
=
T̂ +
B̂ .
ds
R
h
As três equações anteriores são as chamadas de Fórmulas de Frenet.
~
Agora, para A(t)
definida em (4.36), podemos tirar a sua derivada temporal em
termos da base de Frenet:
~
dA
dA1
dA2
dA3
dT̂
dN̂
=
T̂ +
N̂ +
B̂ + A1
+ A2
+ A3
dt
dt
dt
dt
dt
dt
dA1
dA2
dA3
1
−1
=
T̂ +
N̂ +
B̂ + A1 v N̂ + A2 v
T̂ −
dt
dt
dt
R
R
dB̂
=
dt
1
1
B̂ + A3 v N̂ ,
h
h
•C •V •A •Ṕ •T •Ṕ. 289 •Ú •S
daí, a expressão
~ dA1
dA
v
T̂ +
=
− A2
dt
dt
R
v
v
dA2
+ A1 + A3
N̂ +
+
dt
R
h
v
dA3
− A2
+
B̂
dt
h
~
exprime a taxa de variação de A(t)
em termos da base local de Frenet ao longo da
trajetória ~r =~r (t).
Deve-se notar que a aceleração possui apenas componentes no plano osculador.
Nesse sentido, é o sacolejo o responsável (cinemático) por um movimento não-plano,
~ possuir
ou seja, um movimento será não-plano se, e somente se, o vetor sacolejo S
componente não-nula na direção do versor binormal da base de Frenet local associada
ao movimento, pois:
~
v = v T̂ ,
v2
dv
T̂ +
N̂ = aT T̂ + aN N̂ ,
dt
R
daí (verifique), o sacolejo pode ser escrito na forma:
~a =
~ = daT − aN v T̂ + 3 v aT − aN dR N̂ + aN v B̂ .
S
dt
R
R
R dt
h
(4.42)
(4.43)
•C •V •A •Ṕ •T •Ṕ. 290 •Ú •S
h
i
~ . Bem, da expressão para a veloÉ interessante investigar o produto misto ~
v, ~a, S
cidade e para a aceleração, tem-se:
~
v × ~a =
v3
B̂ ,
R
então
~
v6
1
~
~
v × ~a ,
(4.44)
v × ~a · ~
v × ~a · S
=− 2 =
R h h
dessa forma, pode-se tirar o raio de torção (h) a partir da velocidade da aceleração e do
sacolejo, por meio da relação: (observe a importância cinemática do sacolejo)
~
v × ~a · ~
v × ~a
h=
,
(4.45)
~
~
v × ~a · S
enquanto o raio de curvatura pode ser tirada da equação:
3
~
v
.
R = ~
v × ~a Retornando à equação (4.40) – que define a torção –, observamos que:
se
dB̂ ~
= 0 , para qualquer ponto da curva, então a curva é plana.
ds
•C •V •A •Ṕ •T •Ṕ. 291 •Ú •S
~(~r, ~v, t) sobre
Logo, considerando um campo de forças resultante qualquer (ver §4.3) F
uma partícula e uma velocidade ~
v 0 num instante t0 numa posição ~r 0 , se esse campo de
~(~r 0 , ~v 0 , t0 ) for paralelo a esse
forças, sobre o plano que passa por ~r 0 e é paralelo a ~
v 0 , e se F
plano em qualquer instante (para qualquer velocidade e para qualquer posição), então
o movimento da partícula ocorrerá sobre esse mesmo plano. Essa conclusão poderá ser
tirada de uma forma alternativa quando se discute o teorema do momentum angular.
4.2.3.
Algumas observações
4.2.3.1. Sobre o plano osculador
Quando a velocidade e a aceleração de uma partícula são informadas em um dado
instante t, isso significa informar: a velocidade ~
v (t) e a velocidade em um instante
vizinho, t + dt, dadas pelo próprio ~
v (t) e por ~
v (t+dt) = ~
v (t) +~a (t)dt. Se os vetores ~
v (t)
e~
v (t+dt) não forem paralelos, eles definirão o plano paralelo às suas direções e que
passará pelo ponto da trajetória localizado por ~r (t). Esse é o plano osculador que contém:
o ponto localizado por ~r (t) e os vetores ~
v (t) e ~a (t).
4.2.3.2. Interpretação dos componentes da aceleração em termos da base de Frenet
O componente tangencial da aceleração [em (4.42)], (dv/dt)T̂, mede a taxa com que
varia o módulo da velocidade, uma vez que é incompetente para alterar a direção da
velocidade. Afinal, é o componente da aceleração na direção da própria velocidade.
•C •V •A •Ṕ •T •Ṕ. 292 •Ú •S
O componente normal da aceleração, (v2/R)N̂, mede a taxa com que a direção do vetor
velocidade varia. Observa-se que (v2/R)N̂ não pode alterar o módulo da velocidade.
4.2.3.3. Interpretação dos componentes do sacolejo em termos da base de Frenet
~ N̂)N̂, mede como o componente
O componente tangencial do sacolejo [em (4.43)], (S·
tangencial da aceleração varia com o tempo (numa dada trajetória), depende tanto de
como aT quanto aN variam com o tempo, bem como do módulo da velocidade e do raio
de curvatura local.
~ N̂)N̂, mede como o componente normal da aceO componente normal do sacolejo, (S·
leração varia com o tempo (numa dada trajetória), depende das projeções tangencial e
normal da aceleração, do módulo da velocidade, do raio de curvatura local e da sua
taxa de variação temporal.
~ B̂)B̂, mede como o vetor aceleração varia numa
O componente binormal do sacolejo, (S·
direção ortogonal ao plano osculador local (associado à trajetória no instante t). Se esse
componente for nulo durante um determinado intervalo de tempo, então a trajetória
será plana durante esse intervalo de tempo. Quanto maior for o módulo do componente
binormal do sacolejo, mais ‘torcida’ (ou retorcida) será a curva suporte da trajetória (na
vizinhança do instante considerado).
•C •V •A •Ṕ •T •Ṕ. 293 •Ú •S
Figura 4.2: Ilustração de patologias para a base de Frenet.
•C •V •A •Ṕ •T •Ṕ. 294 •Ú •S
4.2.3.4. Quanto ao triedro de Frenet estar definido
A base de Frenet associada a uma trajetória (de uma partícula) pode não estar definida
ou pode não ser localmente única (sob o aspecto espacial). Não estará definida, quando
a curva não possuir tangente no ponto considerado, isto é, quando a curva suporte
da trajetória fizer um “bico”, como no ponto P da Fig. 4.2. Note-se que uma partícula
só pode ter essa curva como suporte da sua trajetória se passar pelo ponto P com
velocidade zero. Por outro lado, poderá não ser localmente única, associados a valores
distintos do parâmetro que descreve a trajetória (tempo) quando a curva fizer um “laço”,
quando para cada valor do parâmetro estiver associado uma reta tangente diferente,
como no ponto A da Fig. 4.2. Em vista desses fatos, as bases locais de Frenet podem não
estar associadas a um sistema de coordenadas curvilíneas ortogonais (independentes
do tempo), onde a trajetória coincide com uma das equi-curvas.
4.3.
Elementos de Análise Vetorial
Consideraremos um referencial e uma região S̃ no espaço físico, além disso, vamos
supor que escolhemos um determinado sistema de coordenadas nesse referencial. Fica,
assim, estabelecida uma bijeção entre os pontos dessa região S̃ e um subconjunto D ⊆ R3 ,
sendo a distância entre dois pontos dada pela norma da diferença dos vetores posição
desses pontos, em relação a qualquer ponto do referencial; em particular, em relação
a origem do sistema de coordenadas adotado. É claro que, escolhendo outro sistema
de coordenadas, mesmo com outro sistema de unidades (no mesmo referencial), fica
•C •V •A •Ṕ •T •Ṕ. 295 •Ú •S
estabelecida outra bijeção de S̃ em24 D0 ⊆ R3 . Mas, a região observada a partir de um
referencial é o que importa; o sistema de coordenadas ou o sistema de unidades não
são preponderantes, uma vez que são arbitrários. Na realidade, essa escolha é útil para
podermos tratar teoricamente a região como um subconjunto do R3 . Isto é, tratá-la
numericamente. O que estamos querendo ressaltar é: pretendemos descrever com o
conjunto D, ou D0 , a própria região S̃, por meio da bijeção. Uma vez que, tomando um
único elemento de D, estamos sempre tomando um único ponto de S̃ e reciprocamente.
São os pontos de S̃ que estamos querendo descrever.
Em seguida definiremos campo escalar e campo vetorial25 .
Definição 4.3.1. Um campo escalar é uma função λ : S̃ → R, definida de S̃ em R.
Isto é, para cada ponto26 de S̃ está associado (ou definido) um único número real
por meio da função λ(~r ).
Exemplos físicos de um campo escalar:
. distância de pontos de uma região até a um determinado ponto;
24 Pode acontecer que D0 = R3 , isso porque a escolha do referencial nos leva a uma bijeção f : E3 → R3 , onde
E3 denota o espaço físico e, aqui, D = f [S̃].
25 A origem da caracterização tensorial das grandezas físicas (i.e., se um “objeto” físico é um escalar [tensor
de ordem zero], um vetor [tensor de ordem 1], um tensor de segunda ordem, ou de ordem n) está na forma
(i.e., na lei) como uma representação se transforma quando se procede a uma mudança de coordenadas (ou
de base local). Um escalar não possui sua representação alterada, no caso da transformação não envolver
mudanças de unidades.
26 Que denotaremos por meio do correspondente vetor posição em relação a um ponto qualquer (fixo no
referencial), ~r .
•C •V •A •Ṕ •T •Ṕ. 296 •Ú •S
. distribuição de temperatura numa região;
. densidade de massa num meio material;
. densidade de carga elétrica;
. energia potencial.
Observe com cuidado como essa definição de campo escalar não depende de um
sistema de coordenadas; porém, tomando um sistema de coordenadas, fica definida
uma bijeção g : S̃ → D. Daí, podemos tratar analiticamente o campo escalar através da
representação g−1 ◦ f : D → R (para essa nomenclatura e notação; ver pág. 37 ou, por
exemplo, [18]).
Definição 4.3.2. Um campo vetorial é uma função de uma região S̃ num espaço vetorial
V, w : S̃ → V.
Em mecânica newtoniana ou em eletromagnetismo, trata-se com espaços vetoriais
normados, de norma euclidiana, de dimensão três sobre o corpo dos reais27 , ou seja,
trabalha-se sempre no que chamamos espaço físico, o qual se costuma considerar como
euclidiano. Em vista disso, tomando um sistema de coordenadas, fica definida uma
bijeção g : S̃ → D; por meio da qual podemos tratar analiticamente o campo vetorial
usando a representação g−1 ◦w : D → V. Note, estamos considerando que, a partir do
sistema de coordenadas, definimos uma base vetorial, que usamos para escrever os
27
Ver, por exemplo, [12].
•C •V •A •Ṕ •T •Ṕ. 297 •Ú •S
vetores como combinação linear. As normas dos vetores de uma base normalizadas
são adimensionais, a dimensionalidade em um vetor fica a cargo dos coeficientes da
combinação linear em termos da base normalizada. Para nossas finalidades, podemos
dizer que em cada ponto (localizado pelo vetor) ~r em S̃ (ou D, diante de g) está definido
~ r ); vetor esse que não difere das grandezas vetoriais estudadas pelo leitor
um vetor V(~
até aqui. Observe com cuidado como essa definição de campo vetorial não depende de
um sistema de coordenadas.
Exemplos físicos de campo vetorial:
. vetor posição de pontos de uma região em relação a um ponto;
. distribuição de velocidade num fluido;
. campo elétrico;
. campo magnético;
. campo gravitacional ;
. campo de forças (de modo geral).
Quando (em relação a um determinado referencial) temos uma força definida em
cada ponto de uma região, dizemos que temos um campo de força nessa região (em
relação a esse referencial).
Ao se adotar o conceito de campo de força, percebe-se uma mudança substancial
da forma com a qual se “pensa” força durante um curso de mecânica no nível de
•C •V •A •Ṕ •T •Ṕ. 298 •Ú •S
primeiro ano de graduação, por exemplo. Nesses cursos, costuma-se considerar uma
~ Com o conceito de campo,
partícula sobre a qual se considera atuar uma força F.
pode-se considerar uma partícula movimentando-se numa região onde está definido
~ = F(~
~ r ), de tal forma que, se ela passa pela posição ~rA , a força
um campo de forças F
~ rA ) = F
~A . Essa concepção inclui a da força
que atua sobre ela (devido a esse campo) é F(~
aplicada sobre uma partícula, uma vez que poderemos considerar o campo
~0
se ~r , ~rA
~ r) =
F(~
~A se ~r = ~rA
F
como significando que atua força não-nula apenas no ponto ~rA , o qual podemos imaginar acompanhando o movimento da partícula, i.e., ~rA =~r (t).
Analisando movimento mediante o conceito de campo de força, observa-se que a
existência de um campo independe da presença de alguma partícula para experimentálo. Dessa forma, é possível estudar isoladamente esses campos. É justamente disso que
se ocupa, por exemplo, um curso de Eletricidade e Magnetismo ou de Eletromagnetismo
(estudam os campos de força associados a cargas elétricas, que atuam sobre cargas
elétricas) ou o de gravitação (que estuda as interações gravitacionais).
Um campo de forças pode ser encarado ainda de uma forma mais geral, afinal,
uma força pode depender: da posição, da velocidade com que passa por essa posição
e do instante em que passa por esse ponto com essa velocidade. Logo, se S̃ é uma
região observada a partir de um referencial inercial, se V é o conjunto das velocidades
(vetoriais) possíveis de uma partícula ao se movimentar nessa região, e se T é o intervalo
•C •V •A •Ṕ •T •Ṕ. 299 •Ú •S
de tempo em que são válidas as observações consideradas, então o campo de forças
será uma função:
w : S̃ × V × T → U ,
onde U é conjunto de forças, ou melhor, um espaço vetorial que representa forças. Daí,
podemos escrever:
~ = F(~
~ r, ~
F
v, t) .
~=E
~ (~r, t)
Por exemplo. Considere uma região onde está definido um campo elétrico E
~ =B
~ (~r, t), onde se encontra uma carga pontual q de massa m,
e um campo magnético B
essa carga elétrica está sujeita ao seguinte campo de forças (conhecido como força de
Lorentz):
~ r, ~
~ r, t) + q ~
~ r, t) .
F(~
v, t) = q E(~
v × B(~
Convivemos intimamente com o campo de força peso. Convido o leitor a uma
reflexão sobre esse campo (que existia antes de você ter nascido, antes mesmo muito
antes do homem inventar a roda), é um ótimo exercício.
Problema 4.4. Uma mola ideal (isto é, com massa desprezível) está em equilíbrio quando o seu comprimento é `, podendo ser comprimida até 43 ` e estendida até 52 `; sua
constante elástica é k. A mola pode girar livremente em torno de um ponto fixo A.
Determine o campo de força associado a essa mola:
1. em relação ao ponto A;
2. em relação a um ponto B, diferente do ponto A.
•C •V •A •Ṕ •T •Ṕ. 300 •Ú •S
A idéia de campo é um dos conceitos mais interessantes e poderosos da física, principalmente porque os campos possuem existência própria e respeitam leis características,
algumas das quais já são bem conhecidas. Esse é o caso do campo eletromagnético que
respeita as leis de Maxwell; a luz, os raios–X, os raios–γ e as ondas de rádio são exemplos de manifestação e existência física de alguns desses campos, independentemente
de qualquer partícula para sofrer alguma interação28 .
Conforme já discutimos, as forças que atuam sobre uma partícula são forças que
podem depender da posição, da velocidade com que a partícula passa por essa posição
e do instante em que passa por essa posição e com essa velocidade. Em vista disso,
é conveniente estender o conceito de campo (vetorial ou escalar) para domínios mais
amplos e mais flexíveis para análises.
Como considerado quando do campo escalar, seja S̃ uma região no espaço físico,
T um intervalo de tempo (o tempo de observação) e V o conjunto das velocidades
possíveis que uma partícula pode possuir nessa região. Seja, ainda, U o conjunto de
“manifestações” possíveis de uma determinada grandeza física (escalar ou vetorial) de
interesse. Consideraremos, então, o campo (escalar ou vetorial):
F : S̃× V× T → U .
Não se costuma tratar matematicamente de forma direta com esses campos, mas
sim por meio de um sistema de coordenadas curvilíneas e unidades adequadas, que
definem as injeções: w, v, τ e u. Seja então as quatro funções: w̄ : S̃ → w[S̃], v̄ : V → v[V],
28
Hoje, independentemente de termos um rádio para sintonizar uma determinada estação de AM ou FM,
o sinal está “disponível”... Os “bips”, os telefones celulares...
•C •V •A •Ṕ •T •Ṕ. 301 •Ú •S
τ̄ : T → τ[T ] e ū : U → u[U], dessa forma,
Fw̄,v̄,τ̄,ū : w[S̃]×v[V]×τ[T ] → u[U] ,
ou seja
Fw̄,v̄,τ̄,ū = ū−1◦F ◦ τ̄−1◦ v̄−1◦ w̄−1
e, daí,
F = ū◦Fw̄,v̄,τ̄,ū! ◦ w̄◦ v̄◦ τ̄ .
4.4.
Gradiente
Nesta seção estudaremos o gradiente de uma função escalar, ou de um campo escalar, com domínio no R3 (i.e., funções de três variáveis reais), quando se faz uso de
coordenadas curvilíneas ortogonais.
Seja f = f (α1 , α2 ,α3 ) uma função de três variáveis, com derivadas contínuas (para
essas variáveis). Em contraste com as funções de uma única variável, quando se
considera um deslocamento do domínio, a função f sofre uma variação ∆ f que depende
também da direção desse deslocamento. É claro que, se nos restringirmos a uma curva
nesse domínio, a função torna-se função de uma única variável (por uma restrição
do domínio a essa curva). A melhor maneira de tratar com essa restrição (ao longo
de uma curva no domínio) é usando um sistema de coordenadas αi = αi (x, y, z); i ∈ I3 ,
•C •V •A •Ṕ •T •Ṕ. 302 •Ú •S
onde x, y e z são coordenadas cartesianas29 que descrevem pontos do domínio, e tais
que, por exemplo, α1 serve como parâmetro para a referida curva, quando α2 e α3
são mantidos constantes (em seu respectivo valor). Analisaremos a diferencial dessa
restrição. Sabemos que (ver §2.12, pág. 201 e, por exemplo, [15, capítulo 2])
3
df =
X ∂f
∂f
∂f
∂f
dα1 +
dα2 +
dα3 =
dαi .
∂α1
∂α2
∂α3
∂αi
(4.46)
i=1
Isso significa o quê? Seja P um ponto do domínio de f , localizado pelo vetor posição ~r .
Em coordenadas cartesianas:
~r = x ı̂ + y ̂ + z k̂ ,
ou, em termos das coordenadas curvilíneas ortogonais α1 , α2 , α3 ,
~r = ~r ·ê1 ê1 + ~r ·ê2 ê2 + ~r ·ê3 ê3 ,
onde [ver (4.11) no §4.1.1], para i ∈ I3 ,
1 ∂~r
êi =
hi ∂αi
∂~r
hi = ∂α i
(4.47)
29 Estamos usando as coordenadas curvilíneas em função das cartesianas por economia de palavras e
para “não complicar” o raciocínio do “iniciante”. É interessante ter sempre em mente a transitividade da
composição de transformações de coordenadas, o que torna geral o raciocínio empregado.
•C •V •A •Ṕ •T •Ṕ. 303 •Ú •S
e, daí,
∂~r
= hi êi .
∂αi
(4.48)
Dessa forma
∂~r
∂~r
∂~r
dα1 +
dα2 +
dα3
∂α1
∂α2
∂α3
3
X
∂~r
dαi
=
∂αi
d~r =
i=1
=
3
X
hi dαi êi ,
(4.49)
i=1
quando as “coordenadas α” são as próprias coordenadas cartesianas, então, nesse caso,
hi ≡ 1 e, daí,
d~r = dx ı̂ + dy ̂ + dz k̂ .
Portanto, d f , dado por (4.46), avalia o incremento da função f quando se passa do ponto
P, localizado por ~r , para o ponto P0 , localizado por ~r +d~r . Ou seja, se (α1 , α2 , α3 ) são as
coordenadas de P, então (α1 +dα1 , α2 +dα2 , α3 +dα3 ) são as coordenadas (curvilíneas) de
P0 . Para diferentes deslocamentos d~r , a partir de um mesmo ponto do domínio, teremos
•C •V •A •Ṕ •T •Ṕ. 304 •Ú •S
diferentes incrementos30 d f . O melhor tratamento para d f é encará-lo na forma:
~ · d~r
d f = ∇f
(4.50)
~ é um campo vetorial, com domínio
para todo ~r e ~r + d~r no domínio de f , onde ∇f
igual ao domínio de f , associado à função escalar f . Conforme veremos, a equação
~ a partir da função (campo escalar) f .
(4.50) possibilita determinar o campo vetorial ∇f
Dessa forma, podemos dizer que a diferencial d f pode ser obtida do produto escalar
~ com o vetor deslocamento d~r . Ou seja, d f (para um dado deslocamento
do vetor ∇f
d~r ) é (a aproximação linear de) o incremento sofrido pela função f na direção desse
~ desempenha papel análogo ao da derivada
deslocamento. Podemos dizer ainda que ∇f
de uma função de uma única variável, permitindo calcular, de forma sistemática, as
~ , para que
derivadas direcionais (conforme veremos no §4.4.1). Cabe-nos determinar ∇f
(4.50) seja equivalente a (4.46). Definiremos essa grandeza em coordenadas curvilíneas
ortogonais, do que tiraremos, como caso particular, a sua expressão em coordenadas
cartesianas. Nossa intenção com este procedimento, longe de complicar, é deixar claro
~ independe do sistema de coordenadas (como toda grandeza vetorial
que o vetor ∇f
que se presa). O leitor deve ficar atento para o fato de as componentes serem, num
dado ponto, tomadas na base local, definida (nesse ponto) pelo sistema de coordenadas
30 Para funções de uma única variável, temos apenas uma única direção para variar d~
r . No caso de mais
de uma variável, temos diferentes direções de d~r e diferentes normas para d~r .
•C •V •A •Ṕ •T •Ṕ. 305 •Ú •S
curvilíneas ortogonais [ver (4.47)]. De (4.46), (4.49) e (4.50), tiramos:
df =
3
X
∂f
i=1
~ · d~r
dαi = ∇f
∂αi
3
X
~ ·
= ∇f
hi dαi êi
i=1
=
3
X
~ · êi dαi
hi ∇f
i=1
como as coordenadas α1 , α2 e α3 são independentes, podemos tomar dα j , 0 e dαk = 0
para k , j, e, daí, precisamos ter: (não se está somando no índice j)
∂f
~ · ê j
= h j ∇f
∂α j
e como
⇒
~ · ê j = 1 ∂ f
∇f
h j ∂α j
j ∈ I3
~ = ∇f
~ · r̂1 ê1 + ∇f
~ · r̂2 ê2 + ∇f
~ · r̂3 ê3 ,
∇f
então podemos tirar finalmente:
!
!
!
~ = 1 ∂ f ê1 + 1 ∂ f ê2 + 1 ∂ f ê3
∇f
h1 ∂α1
h2 ∂α2
h3 ∂α3
(4.51)
•C •V •A •Ṕ •T •Ṕ. 306 •Ú •S
ou, de forma mais compacta:
~ =
∇f
3
X
1 ∂f
êi ,
hi ∂αi
(4.52)
i=1
~ associada à função f é chamada gradionde êi e hi são dados por (4.47). A grandeza ∇f
ente da função f , sendo (4.52) a definição geral em coordenadas curvilíneas ortogonais.
Em coordenadas cartesianas, em particular, temos:
~ = ∂ f ı̂ + ∂ f ̂ + ∂ f k̂ .
∇f
∂x
∂y
∂z
A título de exemplo, desenvolveremos a expressão correspondente em coordenadas
esféricas. Antes de prosseguir, é interessante que o estudante desenvolva como exercício, de forma independente, a expressão em coordenadas polares e a expressão em
coordenadas esféricas. As coordenadas esféricas, r, θ e φ, como em (4.24), são tais que
x = r cos(φ) sen(θ)
(4.53)
y = r sen(φ) sen(θ)
z = r cos(θ)
•C •V •A •Ṕ •T •Ṕ. 307 •Ú •S
Do exposto:
∂~r
= sen(θ) cos(φ) ı̂ + sen(θ) sen(φ) ̂ + cos(θ) k̂
∂r
hr = 1
∂~r
∂θ = r cos(θ) cos(φ) ı̂ + cos(θ) sen(φ) ̂ − sen(θ) k̂
q
h = r cos2 (θ) cos2 (φ) + sen2 (φ) + sen2 (θ) = r
θ
∂~r
= r − sen(θ) sen(φ) ı̂ + sen(θ) cos(φ) ̂
∂φ
q
hφ = r sen(θ) sen2 (φ) + cos2 (φ) = r sen(θ) .
Logo, de (4.52), a expressão do gradiente em coordenadas esféricas é dada por:
∂f
1
~ = ∂ f r̂ + 1 ∂ f θ̂ +
∇f
φ̂ .
r ∂θ
r sen(θ) ∂φ
∂r
(4.54)
Matematicamente, as funções31 λ(x, y, z) e f (α1 , α2 , α3 ) são diferentes, uma vez que
diferem em seus domínios e, daí, na lei de correspondência entre os pontos do domínio
e do contradomínio. Acontece, porém, que agora estamos encarando essas funções de
modo diferente, a saber: como campo escalar. Analisemos esse problema.
31
Tais que λ(x, y, z) = f (α1 (x, y, z), α2 (x, y, z), α3 (x, y, z)).
•C •V •A •Ṕ •T •Ṕ. 308 •Ú •S
Seja S̃ uma região no espaço físico e A uma grandeza física escalar qualquer. Escolhido um sistema de unidades para essa grandeza A fica definida uma bijeção g : A → R,
onde A é o conjunto de todos as possíveis “manifestações” da grandeza A. O que estamos entendendo por campo escalar já está definido, como uma função, pág. 296. Não
podemos, porém, tratar numericamente o campo dessa forma (tão abstrata). Com vista
em possibilitar um tratamento por meio de coordenadas dos pontos em S̃ e dos valores medidos de A, consideraremos um sistema de coordenadas curvilíneas ortogonais
(qualquer) em S̃. Isso define uma injeção w : S → R3 , da qual podemos tirar a bijeção
w̄ : S → w[S̃], tal que32 w̄(χ) = w(χ) para todo χ em S̃. Dessa forma, podemos tratar o
campo como uma função: fw,g : w[S̃] → g[A], onde fw,g = g−1◦ f ◦ w̄−1 , ou seja,
f = g ◦ fw,g ◦ w̄ .
(4.55)
Mesmo tratando com o campo f , trabalharemos com a função fw,g , sem fazer muita
distinção entre elas. O fato importante que deve ser notado é: o tratamento do campo
não pode depender da representação, isso está expresso em (4.55).
Do que vimos, a todo campo escalar diferenciável está associado uma função que,
a cada ponto da região S̃, faz associar um vetor, a saber o gradiente (local) do campo
escalar. O gradiente é, por sua vez, um campo vetorial associado a um campo escalar.
Isso não significa, porém, que todo campo vetorial seja o gradiente de algum campo
escalar.
Discutiremos alguns aspectos do gradiente de um campo escalar.
32
Observa-se que w[S] ⊂ R3 .
•C •V •A •Ṕ •T •Ṕ. 309 •Ú •S
4.4.1.
Relação entre derivada direcional e gradiente
Vamos supor que queremos avaliar a taxa de variação da função f quando se considera
incrementos no seu domínio na direção de um versor û. Nesse caso podemos escrever:
d~r = |d~r | û e, daí,
~ · d~r = ∇f
~ · û |d~r | .
d f = ∇f
(4.56)
~ ·û é justamente a derivada da função f na direção û, no ponto consideDessa forma, ∇f
rado, isto é, a derivada direcional da função.
4.4.2.
Significado da direção do vetor gradiente
Qual o significado da direção do vetor gradiente? Essa é uma pergunta muito freqüente
e a sua resposta é muito instrutiva. Considere um deslocamento d~r que forma um
ângulo θ com a direção do gradiente da função no ponto considerado. Dessa forma
~ f · d~r cos(θ) ,
(4.57)
d f = ∇
como −1 ≤ cos(θ) ≤ 1, temos que, para |d~r | fixo, d f será máximo quando θ = 0, i.e.,
cos(θ) = 1. Isso significa que
~ , no ponto considerado, é a direção para a qual a função f
a direção de ∇f
apresenta o maior incremento, ou seja, é a direção de derivada direcional
máxima.
•C •V •A •Ṕ •T •Ṕ. 310 •Ú •S
4.4.3.
Gradiente de operações com funções
Se f1 e f2 são dois campos escalares com o mesmo domínio e o mesmo contradomínio
e se a1 e a2 são dois números reais, então valem as seguintes propriedades:
~ a1 f1 + a2 f2 = a1 ∇f
~ 1 + a2 ∇f
~ 2
∇
(4.58)
~ f1 f2 = f1 ∇f
~ 2 + f2 ∇f
~ 1
∇
(4.59)
que se seguem da própria linearidade da diferencial e da distributividade do produto
escalar em relação a adição de vetores. Por meio de (4.58), vê-se que a lei de composição
do gradiente é a mesma que de uma grandeza vetorial, o que corrobora considerarmo-lo
realmente como um campo vetorial.
4.4.4.
Gradiente das coordenadas curvilíneas ortogonais
Apresentaremos um resultado trivial, mas de grande utilidade, o gradiente de uma
coordenada curvilínea que compõe um sistema de coordenadas curvilíneas ortogonais,
digamos (α1 , α2 , α3 ). De (4.52), tiramos:
~ i=
∇α
3
3
X
1 ∂αi X 1
1
ê j
=
ê j δαi α j = êi .
h j ∂α j
hj
hi
j=1
j=1
Portanto, além de (4.48), temos [não estamos somando no índice i]
~ i.
êi = hi ∇α
•C •V •A •Ṕ •T •Ṕ. 311 •Ú •S
Em resumo:
~ i = 1 ∂~r .
êi = hi ∇α
hi ∂αi
(4.60)
Isso enseja escrever a equação (numa forma bem sintética), a saber:
~ =
∇f
3
X
∂f
i=1
4.4.5.
∂αi
~ i.
∇α
O operador nabla
~ como um operador, o chamado operador
É possível encarar formalmente o símbolo ∇
vetorial nabla, o qual, aplicado a um campo escalar f (~r ), fornece o seguinte campo
vetorial, em termos das coordenadas curvilíneas (χ1 , χ2 , χ3 ):
3
!
X êi ∂
f = 1 ê ∂ + 1 ê ∂ + 1 ê ∂
~ =
∇f
f
1
2
3
hi ∂χi
h1 ∂χ1 h2 ∂χ2 h3 ∂χ3
i=1
=
3
X
i=1
∂f
∂f
∂f
êi ∂ f
1
1
1
f =
+
+
.
ê1
ê2
ê3
hi ∂χi
h1 ∂χ1 h2 ∂χ2 h3 ∂χ3
Conforme veremos, esse operador poderá ser utilizado para “operar” outros campos
vetoriais (divergente e rotacional).
•C •V •A •Ṕ •T •Ṕ. 312 •Ú •S
4.5.
Divergente
~ r ) trata justamente com o fluxo
A definição do divergente de um campo vetorial A(~
médio do campo por meio de numa superfície fechada que contenha o ponto desejado
em seu interior quando o volume definido por essa superfície tende a zero, contendo
sempre o ponto desejado. Vamos por partes. Seja ∂S uma superfície fechada contida
no domínio do campo vetorial, se ~r (β1 , β2 ) é uma equação paramétrica para essa curva,
então
Z Z
~ (~r (β1 , β2 )) · d~a
A
(4.61)
Φ=
β1
β2
~ através da superfície ∂S, onde d~a é um vetor diferencial perpené o fluxo do campo A
dicular à superfície ∂S, orientado do interior para o exterior da superfície. Uma dúvida
freqüente: como determinar o vetor d~a ? Bem, para uma parametrização, ~r (β1 , β2 ), da
superfície ∂S, os vetores
∂~r
∂~r
e
∂β1
∂β2
não podem ser paralelos, do contrário, não teríamos como determinar pontos sobre
a superfície numa vizinhança qualquer sobre a superfície. Dessa forma, o produto
vetorial desses dois vetores é um vetor perpendicular à superfície. Além disso, os
vetores
∂~r
∂~r
dβ1 e
dβ2
∂β1
∂β2
•C •V •A •Ṕ •T •Ṕ. 313 •Ú •S
são dois vetores infinitesimais, não paralelos, tangentes à superfície no ponto correspondente aos parâmetros β1 e β2 , cuja norma do produto vetorial é numericamente
igual à área do paralelogramo infinitesimal definido pelos vetores anteriores. Portanto,
podemos considerar o vetor elemento de área:
d~a =
∂~r
∂~r
×
dβ1 dβ2 .
∂β1 ∂β2
(4.62)
Finalmente, podemos expressar a integral em (4.61) em termos dos parâmetros usados
para descrever a superfície ∂S. Sendo βi ∈ (ai , bi ) o domínio desses parâmetros, temos:
Zb1 Zb2
Φ=
β1 =a1 β2 =a2
"
#
~ (~r (β1 , β2 )) · ∂~r × ∂~r dβ1 dβ2 .
A
∂β1 ∂β2
Por outro lado, a superfície fechada ∂S encerra o volume
Z Z Z
V=
dx dy dz .
x
y
(4.63)
(4.64)
z
Não nos deteremos nos detalhes do cálculo desse volume, nossa intenção agora é
determinar uma expressão para o divergente de um campo vetorial quando abordado
por meio de coordenadas curvilíneas ortogonais. Para esse objetivo estudaremos o
teorema de Gauss e, como expressar um elemento de volume e um elemento de área em
•C •V •A •Ṕ •T •Ṕ. 314 •Ú •S
coordenadas curvilíneas. Antes, definiremos formalmente o campo escalar divergente
~(~r ):
de um campo vetorial A
)
(
I
1
~
~
A(~r ) · d~a ,
(4.65)
divA(~r ) ≡ lim
∆V→0 ∆V
∆S
onde ∆V é o volume de uma região que contém o ponto onde se calcula o divergente
do campo e ∆S é a área da superfície (externa) que limita essa região.
4.5.1.
Teorema de Gauss
Da definição de divergente e da de integral:
Z
V
~(~r ) dV = lim
divA
n→∞
n n
X
o
~
(∆Vi ) divA
i=1
"
#)
I
∞ (
X
1
~
=
(∆Vi ) lim
A · d~a
∆Vi →0 ∆Vi
∆Si
i=1
∞ I
X
~ · d~a .
= lim
A
∆Vi →0
i=1
∆Si
Como cada ∆Si é uma área orientada para fora do respectivo ∆Vi , então entre as
paredes de ∆Vi a soma é nula, restando apenas a contribuição da superfície ∂V externa
•C •V •A •Ṕ •T •Ṕ. 315 •Ú •S
ao volume V. Dessa forma se segue o chamado teorema de Gauss:
Z
I
~ · d~a .
~ dV =
A
divA
V
4.5.2.
∂V
(4.66)
Linearidade do operador divergente
Teorema 4.5.1. O operador divergente é linear.
~ = a1 A
~1 + a2 A
~2 , onde os ai são constantes escalares e os A
~i são campos
Prova. Seja A
vetoriais, todos definidos num mesmo domínio. Então:
I 1
~
~ 1 + a2 A
~
~2 · d~a
div a1 A1 + a2 A2 = lim
a1 A
∆V→0 ∆V ∆S
( I
)
I
1
~
~
a1
A1 · d~a + a2
A2 · d~a
= lim
∆V→0 ∆V
∆S
∆S
)
(
I
1
~1 · d~a +
A
= a1 lim
∆V→0 ∆V ∆S
(
)
I
1
~2 · d~a
+ a2 lim
A
∆V→0 ∆V ∆S
~1 + a2 divA
~2 .
= a1 divA
•C •V •A •Ṕ •T •Ṕ. 316 •Ú •S
4.5.3.
Elemento de volume em coordenadas curvilíneas ortogonais
Sendo o deslocamento d~r expresso em coordenadas curvilíneas ortogonais (α) por
d~r =
3
X
∂~r
i=1
∂αi
dαi =
3
X
hi êi dαi ,
(4.67)
i=1
e sendo {êi } uma base ortonormal, o elemento de volume pode ser expresso mediante o
módulo do produto misto dos vetores (d~r ·êi) êi (não se soma), mas podemos dispensar
o módulo considerando a base ordenada como uma base direta33
33
Dizemos que uma base ortonormal â1 , â2 , â3 é direta, se â3 = â1 × â2 , ou, equivalentemente, se
â1 = â2 × â3 = −â3 × â2 = 12 (â2 × â3 − â3 × â2 ) ,
3
ou então podemos escrever mais genericamente: âi =
1X
εi jk â j × âk , onde o símbolo
2
j,k=1
εi jk
1,
=
−1 ,
0,
se ijk formam uma permutação par de 123
se ijk formam uma permutação ímpar de 123
se um dos índices for repetido
(4.68)
é o chamado tensor (anti-simétrico) de Levi-Civita.
•C •V •A •Ṕ •T •Ṕ. 317 •Ú •S
h
i
dV = (d~r · ê1 ) ê1 , (d~r · ê2 ) ê2 , (d~r · ê3 ) ê3
(4.69)
= h1 h2 h3 dα1 dα2 dα3
=
3
Y
hi dαi .
i=1
4.5.4.
Elemento de área em coordenadas curvilíneas ortogonais
Queremos determinar uma expressão para o vetor elemento de área sobre a superfície
αi constante, orientada no sentido em que αi é crescente. Seja d~ai esse elemento de
área (direção e sentido, no caso de coordenadas ortogonais, são idênticos aos do vetor
∂~r/∂αi = hi êi ). Sendo {ê1 , ê2 , ê3 } uma base ortonormal direta, o elemento (vetorial) de
área pode ser escrito na forma:
d~ai =
!
!
3
1 X 2 ∂~r
∂~r
εijk
dα j ×
dαk
2
∂α j
∂αk
j,k=1
3
o
1 Xn 2
=
εijk h j hk dα j dαk êi .
2
j,k=1
•C •V •A •Ṕ •T •Ṕ. 318 •Ú •S
4.5.5.
Divergente dos vetores de uma base associada a um sistema de
coordenadas curvilíneas ortogonais
Da definição de divergente (4.65) aplicada a cada vetor de uma base local associada a
um sistema de coordenadas curvilíneas ortogonais, temos
I
1
divêi = lim
êi · d~a .
∆V→0 ∆V ∆S
Sejam σ j+ e σ j− , j ∈ I3 , oito (8) superfícies que unidas formam uma superfície fechada,
∆S, de pontos vizinhos de um ponto P de coordenadas (α1 , α2 , α3 ) e tais que, dados ∆α1 ,
∆α2 e ∆α3 (não-nulos)34 ,
σ j+ : é um setor da “equi-α j ” para α j +∆α j constante;
σ j− : é um setor da “equi-α j ” para α j −∆α j constante.
34
Essas superfícies são limitadas pela interseção com as outras superfícies “σ” que compõem ∆S.
•C •V •A •Ṕ •T •Ṕ. 319 •Ú •S
Dessa forma, denotando ᾱi+ = αi + 12 ∆αi e ᾱi− = αi − 12 ∆αi ,
I
∆S
3 Z Z
X
êi · d~a =
j=1
êi · d~a j
σ j−
Z Z
σ j+
êi · d~a j +
Z
Z
3
ᾱk+ ᾱ`+ 2
1 X
ε (ê ·ê ) h h dα dα =
ᾱk− ᾱ`− jk` i j k ` k ` ᾱ
2
j,k,`=1
Z
+
ᾱk+
ᾱk−
Z
ᾱ`+
ᾱ`−
ε2jk`
j+
(êi·ê j ) hk h` dαk dα` ᾱ j−
.
•C •V •A •Ṕ •T •Ṕ. 320 •Ú •S
Somando em j, em primeira aproximação, temos: (Ω denota a soma dos termos de
ordem superior em ∆α1 , ∆α2 e ∆α3 )
I
3
X
2
2
1
êi · d~a = 2
ε
h
h
∆α
∆α
−
ε
h
h
∆α
∆α
+Ω
`
`
k `
k
k `
k
ik`
ik`
∆S
ᾱi+
k,`=1
=
1
2
3
X
k,`=1
"
− ε2ik`
=
1
2
3
X
ᾱi−
(
"
#
∂ 1
ε2ik`
hk h`
∆αi ∆αk ∆α` −
2
∂αi
"
ε2ijk
k,`=1
#
)
∂ hk h`
− 12 ∆αi ∆αk ∆α` + Ω
∂αi
#
∂ hk h` ∆α1 ∆α2 ∆α3 + Ω .
∂αi
Dessa forma:
divêi = lim
∆α→0
1
2
P3
j,k=1
ε2ijk
h
∂
∂αi
i
h j hk ∆α1 ∆α2 ∆α3
h1 h2 h3 ∆α1 ∆α2 ∆α3
+0,
•C •V •A •Ṕ •T •Ṕ. 321 •Ú •S
onde ∆α → 0 está sintetizando o limite para cada um dos “∆α” tendendo a zero. Portanto, finalmente, podemos escrever:
3
1
∂ 1 X 2
divêi =
εi jk h j hk .
(4.70)
h1 h2 h3 ∂αi 2
j,k=1
4.5.6.
Divergente de um campo vetorial em coordenadas curvilíneas
ortogonais
A demonstração do parágrafo anterior leva-nos à demonstração para a expressão do
divergente de um campo vetorial qualquer, com domínio numa região do espaço físico,
~(~r ) = Ai (~r )êi :
em termos de um sistema de coordenadas curvilíneas ortogonais. Para A
3
X
I
1
Ai êi · d~a =
∆V→0 ∆V ∆S
i=1
(Z Z
X
1
(Ai êi ) · ε2jk` hk h` dαk dα` ê j +
= 21
lim
∆V→0 ∆V
σ+
i, j,k,`
)
Z Z
2
(Ai êi ) · ε jk` hk h` dαk dα` ê j
+
~=
divA
lim
σ−
•C •V •A •Ṕ •T •Ṕ. 322 •Ú •S
∆α
∆α
α` + 2 ` αk + 2 k
Z
Z
X
1
2
εik` Ai hk h` dαk dα` = 12
lim
−
1
∆V→0 ∆V
αi + 2 ∆αi
i,k,`
α − ∆α` α − ∆αk
`
k
2
2
∆α
∆α`
α` + 2 αk + 2 k
Z
Z
2
εik` Ai hk h` dαk dα` −
1
αi − 2 ∆αi
∆α`
∆αk
α−
α−
`
=
1
2
X
i,k,`
2
k
2
2
εik` Ai hk h` ∆αk ∆α` −
∆αi
αi + 2
2
− εik` Ai hk h` ∆αk ∆α` + Ω
∆αi
1
lim
∆V→0 ∆V
αi −
=
1
2
X
i,k,`
(
lim
∆V→0
2
)
1 2 ∂(Ai hk h` )
ε
∆αi ∆αk ∆α` + 0
∆V ik` ∂αi
)
1
2 ∂(Ai hk h` )
=
lim
ε
∆αi ∆αk ∆α`
∆α→0 h1 h2 h3 ∆α1 ∆α2 ∆α3 + Ω ik` ∂αi
i,k,`
(
)
X
1
2 ∂(Ai hk h` )
~= 1
divA
lim
ε
∆α
∆α
∆α
i
` .
k
2
∆α→0 h1 h2 h3 ∆α1 ∆α2 ∆α3 ik` ∂αi
1
2
(
X
i,k,`
•C •V •A •Ṕ •T •Ṕ. 323 •Ú •S
Portanto:
~(~r ) =
divA
1
2
X
i, j,k
=
1
2
X
i, j,k
~(~r ) =
divA
3
X
i=1
~ · êi ) h j hk
∂ (A
ε2ijk
h1 h2 h3 ∂αi
(4.71)
ε2ijk
∂ ~ h~ i
(A · ∇αi ) hi h j hk
h1 h2 h3 ∂αi
1
h1 h2 h3
(
)
∂ ~ h~ i
(A · ∇αi ) hi h j hk .
∂αi
Dessa última expressão podemos escrever o operador divergente:
div =
3
X
i=1
∂
1
~ i · .
h1 h2 h3 ∇α
h1 h2 h3 ∂αi
(4.72)
~(~r ) um campo vetorial, ambos definidos numa mesma
Seja φ(~r ) um campo escalar e A
região. Estamos em posição para demonstrar uma identidade envolvendo o campo
•C •V •A •Ṕ •T •Ṕ. 324 •Ú •S
~(~r ):
~ = φ(~r )A
vetorial B
3
X
o
1
∂ n
~
~ i · φA
h1 h2 h3 ∇α
h1 h2 h3
∂αi
i=1
(
3
X
i
∂ h
1
~ +
~ i ·A
φ
h1 h2 h3 ∇α
=
h1 h2 h3
∂αi
i=1
)
i
∂φ h
~
~
+
h1 h2 h3 ∇αi · A
∂αi
~ =
div φ A
~+
= φ divA
3
X
1 ∂φ ~
A · êi .
hi ∂αi
i=1
Então, pela expressão do gradiente [equação (4.52)]
~ = φ divA
~ + ∇φ
~.
~ ·A
div φ A
4.5.7.
(4.73)
O laplaciano em coordenadas curvilíneas
Possui grande importância em física o gradiente do divergente, nesse sentido, dado um
campo escalar φ(~r ), define-se o laplaciano do campo φ:
~ .
∇2 φ ≡ div ∇φ
(4.74)
•C •V •A •Ṕ •T •Ṕ. 325 •Ú •S
Portanto, de (4.52) e de (4.71), temos em coordenadas curvilíneas ortogonais:
3
X 1 ∂φ
2
ês
∇ φ = div
hs ∂αs
s=1
3
X ε2ijk ∂ X
1 ∂φ
1
ês · êi h j hk
=2
h1 h2 h3 ∂αi
hs ∂αs
s=1
i,j,k
=
1
2
X
i,j,k
ε2ijk
!
1 ∂φ
∂
h j hk .
h1 h2 h3 ∂αi hi ∂αi
De onde tiramos uma expressão para o laplaciano em coordenadas curvilíneas ortogonais:
3
X
1
∂ h1 h2 h3 ∂φ
2
∇ φ=
(4.75)
.
h1 h2 h3 ∂αi h2i
∂αi
i=1
A título de exercício deixamos a cargo do leitor a determinação das expressões do
divergente e do laplaciano em coordenadas cartesianas, em coordenadas cilíndricas e
em coordenadas esféricas.
•C •V •A •Ṕ •T •Ṕ. 326 •Ú •S
4.6.
Rotacional
A definição do rotacional é menos direta que a do gradiente ou do divergente; enquanto
o divergente está associado com o fluxo médio limite de um campo vetorial, o rotacional
é um campo vetorial associado com a circulação média limite de outro campo vetorial.
~ = A(~
~ r ) ∈ C1 , define-se o rotacional do
Formalmente: dado um campo vetorial A
~
~
campo A como sendo o campo (rotA ) cuja componente na direção (e sentido) de um
versor û é dado por:
I
~ · d`~ ,
~ · û = lim 1
A
(4.76)
rotA
∆S→0 ∆S Γ
û
onde Γû é uma curva fechada sobre uma superfície de elemento de área ∆S, a qual
contém o ponto considerado e cuja normal orientada (no ponto considerado) é (de
mesmo sentido e) paralela ao versor û, de tal maneira que δ~r , d`~ e û formam (nessa
ordem) um triedro direto, sendo δ~r um vetor posição de um ponto de Γ em relação a
um ponto da região aberta contida na superfície.
Deve-se observar que o campo local fica determinado quando se conhece as componentes do campo em relação a três versores não coplanares.
4.6.1.
Expressão do rotacional em
coordenadas curvilíneas ortogonais
Seja a base ortonormal (direta) {ê1 , ê2 , ê3 } (nessa ordem) associada com as coordenadas
curvilíneas ortogonais (α1 , α2 , α3 ). Como estamos diante de uma base direta, então,
•C •V •A •Ṕ •T •Ṕ. 327 •Ú •S
dados ∆α1 , ∆α2 e ∆α3 (não-nulos), podemos considerar a seguinte curva Γ1 , definida
pelos circuitos associado ao ponto de coordenadas (α∗1 , α∗2 , α∗3 ):
. do ponto (α∗1 , α∗2 −∆α2 , α∗3 −∆α3 ) até o ponto (α∗1 , α∗2 +∆α2 , α∗3 −∆α3 ) sobre a curva
α3 = α∗3 −∆α3 ;
. do ponto (α∗1 , α∗2 +∆α2 , α∗3 −∆α3 ) até o ponto (α∗1 , α∗2 +∆α2 , α∗3 +∆α3 ) sobre a curva
α2 = α∗2 +∆α2 ;
. do ponto (α∗1 , α∗2 +∆α2 , α∗3 +∆α3 ) até o ponto (α∗1 , α∗2 −∆α2 , α∗3 +∆α3 ) sobre a curva
α3 = α∗3 +∆α3 ;
. do ponto (α∗1 , α∗2 −∆α2 , α∗3 +∆α3 ) até o ponto (α∗1 , α∗2 −∆α2 , α∗3 −∆α3 ) sobre a curva
α2 = α∗2 −∆α2 ;
como também, procedendo a uma permutação cíclica de 1 2 3, pode-se considerar as
curvas: Γ2 e Γ3 . Levando em conta (4.76) e o símbolo εi jk , podemos usar uma forma
geral que discrimina a orientação dos trechos dos circuitos, com efeito:
•C •V •A •Ṕ •T •Ṕ. 328 •Ú •S
I
~ · êi = lim 1
~ · d~l =
rotA
A
∆S→0 ∆S Γ
i
Z ᾱ j+
1 X
~
= lim
1−δi j
A · h j ê j dα j εi jk −
∆S→0 ∆S
ᾱ j−
j,k
ᾱk+
Z ᾱ j+
~ · h j ê j dα j εi jk
A
−
ᾱ j−
ᾱk−
X
1
~ · ê j ∆α j 1−δi j εi jk h j A
−
= lim
ᾱk+
∆S→0 ∆S
j,k
−
~ · ê j ∆α j hj A
ᾱk−
)
+Ω
"
(
∂ ~ 1 X 1−δi j εi jk
h j A · ê j ∆α j 12 ∆αk −
= lim
∂αk
∆S→0 ∆S
j,k
#)
∂ ~ −
h j A · ê j ∆α j − 12 ∆αk
∂αk
#
)
(
"
1 X ∂ ~ = lim
1−δi j εi jk
h j A · ê j ∆αk ∆α j
∂αk
∆S→0 ∆S
j,k
"
(
#
)
X
1
∂
~ · ê j ∆αk ∆α j
εi jk
= lim
hj A
∂αk
∆S→0 ∆S
j,k
X
∂ ~ 2
εi jk
h j A · ê j ∆α j ∆αk ,
= lim X
∂αk
∆α→0
{ε2ipq hq hp ∆αp ∆αq }+Ω jk
pq
•C •V •A •Ṕ •T •Ṕ. 329 •Ú •S
como os índices p, q, j e k são todos diferentes de i e como p , q e j , k para as parcelas
não-nulas, então
∆α j ∆αk = ∆αp ∆αq ,
X
∂ ~ ~ · êi = P n 2
o
h j A · ê j
εijk
rotA
2
∂αk
pq εipq hq hp
jk
X
2
∂ ~ o
=P n
h j A · ê j
εijk hi
2
∂αk
pq εipq hq hp hi
jk
X
2
∂ ~ .
h j ê j · A
=
εijk hi
2h1 h2 h3
∂αk
jk
Dessa forma,
~=
rotA
3
X
1
∂ ~
εijk hi êi
h j ê j · A
h1 h2 h3
∂αk
(4.77)
i,j,k=1
é a expressão para o rotacional em coordenadas curvilíneas ortogonais.
•C •V •A •Ṕ •T •Ṕ. 330 •Ú •S
Apêndices
•C •V •A •Ṕ •T •Ṕ. 331 •Ú •S
Apêndice A
Números Naturais
Resolvemos incluir como apêndice algumas noções dos números naturais por dois motivos: a sua importância intrínseca para a matemática e pelo fato de vários sistemas
quânticos apresentarem espectros discretos de energia, os quais são bem descritos pelos números naturais. Iniciaremos enunciando os chamados axiomas de Peano: (ver [18,
capítulo II, §1])
Considere uma função s : N → N, sendo s(n) chamado sucessor de n e sendo N
o conjunto dos números naturais, cujos elementos ficam definidos por meio da
função s e pelos seguintes postulados:
•C •V •A •Ṕ •T •Ṕ. 332 •Ú •S
AP.1 a função s : N → N é injetiva;
AP.2 o conjunto N−s[N] consta de um único elemento, ele será representado pelo
símbolo 1 e chamado “um”;
AP.3 (princípio da indução) se X ⊂ N é um conjunto tal que 1 ∈ X e, para todo n ∈ X,
tem-se que s(n) ∈ X, então X = N.
Observa-se que o conjunto N está definido pela função s mediante os postulados para
N e s. Qualquer demonstração para validade de uma proposição que seja válida para
o conjunto dos números naturais, baseia-se no princípio da indução, quando é referida
como demonstração por indução. Ainda por definição, denotamos s(1) = 2, chamado
“dois”, s(2) = 3, s(3) = 4, etc.
Agora, considere uma sobrejeção f : Y → Y, mesmo não tendo estrutura algébrica
de grupo, o conjunto das sobrejeções sobre Y munido da operação de composição de
funções (os elementos não possuem inverso, necessariamente), é possível definir (e
usar) a seguinte notação: f 1 = f e f s(n) = f ◦ f n , qualquer que seja n ∈ N. A função f n é
chamada a n-ésima iterada de f . A adição nos naturais pode ser entendida, com base na
função sucessor, como:
m + n ≡ sn (m) .
Portanto m+1 = s(m) e, como
m + s(n) = ss(n) (m) = s(sn (m)) = s(m + n) ,
∀m, n ∈ N ,
vê-se que a adição nos naturais também é comutativa. É fácil provar [deixamos como
problema] que a adição (em N) é associativa, é comutativa, admite a lei do corte e segue
•C •V •A •Ṕ •T •Ṕ. 333 •Ú •S
a tricotomia, i.e.: “dados m, n ∈ N exatamente uma das três alternativas pode ocorrer:
ou m = n, ou existe p ∈ N tal que m = n+p ou, então, existe q ∈ N tal que m+q = n”.
Podemos definir o que se entende por multiplicação nos naturais da seguinte maneira:
m·1 = m e m·(n+1) = (sm )s(n) (m) ,
quaisquer que sejam m, n ∈ N, isto é, o produto entre dois números naturais é tal que:
m · 1 = m ,
m · (n + 1) = m · n + m .
Pode-se provar que a multiplicação nos naturais é associativa, é comutativa, segue a lei
do corte e é distributiva em relação a adição.
Dado x ∈ N, dizemos que x é par se existe n ∈ N tal que x = 2n e dizemos que x = 1 é
ímpar e que x é ímpar se existe um natural n tal que y = (2n)+1. Dessa forma, um número
natural ou é par ou é ímpar, com efeito, 1 é ímpar; s(1) é par; se y é ímpar, então seu
sucessor é par [uma vez que existe n tal que y = 2n+1 e s(y) = 2n+2 = 2(n+1)] e, se y é
par, então seu sucessor é ímpar [uma vez que existe y = 2n e s(y) = 2n+1].
Pode-se provar as seguintes propriedades:
1. a soma de dois pares é par;
2. a soma de dois ímpares é par;
3. o produto de um número par com qualquer natural é par;
•C •V •A •Ṕ •T •Ṕ. 334 •Ú •S
4. o produto de dois números ímpares é ímpar;
5. o quadrado de dois pares é par;
6. o quadrado de dois ímpares é ímpar.
Provaremos a quarta propriedade e deixaremos a das outras como problema. Se os
naturais a e b são ímpares, então:
– se um dos dois for igual a 1, o produto será ímpar;
– se a e b são diferentes de 1, existem naturais m e n tais a = 2n+1 e b = 2m+1; portanto,
ab = (2n+1)(2m+1) = 4mn+2(m+n)+1 = 2(2mn+m+n)+1 ,
que é um número ímpar.
A.1.
A raiz quadrada de 2 não é racional, uma prova
Na realidade, este parágrafo é uma aplicação dos números naturais e dos conceitos de
número par e número ímpar. O conjunto dos racionais (ver pág. 116) é bem conhecido,
bem como as operações de adição, subtração, multiplicação e divisão (em Q). A origem
histórica dos inteiros talvez se deva à necessidade de dar significado à operação de
subtração entre naturais; a do conjunto dos racionais de dar significado à operação de
•C •V •A •Ṕ •T •Ṕ. 335 •Ú •S
divisão entre inteiros. Dizemos que um número x é racional se existem inteiros m e n
tais que
m
x=
.
n
Dizemos que um inteiro m é par se |m| é par, caso contrário, diremos que ele é ímpar, ou,
equivalentemente, m é par se existe um inteiro n tal que m = 2n e m é ímpar se existe um
inteiro n tal que m = 2n−1. Dessa forma 0 ∈ Z é par.
Dado um racional na forma y = m/n, é sempre possível escrevê-lo sob uma forma
em que m e n não sejam ambos pares (caso contrário, seria sempre possível simplificar
o fator 2 em ambos). √
Vamos supor que 2 seja racional, isto é, que existam dois inteiros a e b (não ambos
√
pares) tais que 2 = a/b. Se o numerador for ímpar, então podemos escrever: (m, n ∈ Z)
√
2=
2m + 1
n
portanto
⇒
2=
2(2m2 + 2m) + 1
,
n2
2n2 = 2(2m2 + 2m) + 1
que é um absurdo, uma vez que iguala um inteiro par a um inteiro ímpar, independentemente de n ser par ou ímpar. Se o denominador for ímpar, devemos analisar mais
duas possibilidades: numerador par, nesse caso
√
2=
2m
2n + 1
⇒
2=
4m2
4n2 + 4n + 1
•C •V •A •Ṕ •T •Ṕ. 336 •Ú •S
dessa forma,
2(2n2 + 2n) + 1 = 2m2
também um absurdo; finalmente, se o numerador for ímpar:
√
2m + 1
2=
2n + 1
⇒
2=
4m2 + 4m + 1
4n2 + 4n + 1
dessa forma,
2[2(2n2 + 2n) + 1] = 2(2m2 + 2m) + 1 ,
√
novamente um absurdo. Portanto a hipótese é falsa e 2 < Q. Esse fato levou a muita
discussão entre os geômetras gregos (escola pitagórica, Grécia, século VI A.D.) que
consideravam que toda realidade poderia ser descrita por meio de números racionais.
A diagonal de um quadrado de lado unitário, significaria o quê? O conceito de número
real, com a inclusão dos irracionais, resolveu esse problema, por sua vez, os números
complexos resolveram a questão da solução de equações algébricas de coeficientes
reais.
•C •V •A •Ṕ •T •Ṕ. 337 •Ú •S
Apêndice B
Tabela ilustrativa para a derivada
de uma função
Não é nosso objetivo incluir um capítulo específico para estudar limite e derivada, mas
incluímos este apêndice como um meio de reflexão.
Colocamos aqui as Tab. B.1 e Tab. B.2 que ilustram a razão entre o incremento de uma
função e o da variável. Usamos como exemplo uma função do tipo G(x) = Aebx cos (ωx),
uma vez que queremos ilustrar por meio de uma função não-monótona. Escolhemos
dois pontos ilustrativos: x0 = 0,5 e x0 = 0; em cada tabela, na primeira coluna listamos
•C •V •A •Ṕ •T •Ṕ. 338 •Ú •S
vários incrementos ∆x, dispostos em ordem decrescente; na segunda coluna listamos
o incremento sofrido pela função correspondente a esse incremento a partir do ponto
x0 , i.e., ∆G = G(x0 + ∆x) − G(x0 ); finalmente, na terceira coluna listamos a razão ∆G/∆x
correspondente. Aproveitamos para incluir um programa simples (em , §B.0.1)
para levantar esse tipo de tabela para uma função qualquer.
•C •V •A •Ṕ •T •Ṕ. 339 •Ú •S
B.0.1.
Programa
’=================================
’== programa <DERIVADA.BAS> ==
’=================================
’programa ilustrativo da derivada
’
CLS : MAXFILES = 2
DEFDBL A-Z
SQ = 6.5#
DEF FNG (X) =.2# * COS(SQ * X) * EXP(X)
DEF FNDG (X) = -SQ *.2# * SIN(SQ * X) * EXP(X) + FNG(X)
F$ = "G(X) = 0.2*cos(6.5*X)*EXP(X)"
OPEN "Tabela-1.TXT" FOR OUTPUT AS #1
PRINT F$: PRINT
PRINT #1, CHR$(14); F$: PRINT #1,
PRINT #1,
IM = 20: K = 0!
FOR J =.3# TO 25# STEP.5
C =.2 + J
Y = FNG(C)
PRINT #1, "X="; C; " G(X)="; Y: PRINT #1,
PRINT "X="; C; " G(X)="; Y
PRINT #1, USING "\ \";
" delta X"; " delta Y"; " DY/DX"
PRINT #1, STRING$(52, "_")
PRINT USING "\ \";
" delta X"; " delta Y"; " DY/DX"
PRINT STRING$(52, "_")
DX = 16#: RE = 0
•C •V •A •Ṕ •T •Ṕ. 340 •Ú •S
FOR I = 1# TO 527#
DX = DX / (2#)
DG = FNG(C + DX) - Y
R = DG / DX
PRINT #1, USING "+#.#######^^^^"; DX;
PRINT USING "+#.#######^^^^"; DX;
PRINT #1, " "; USING "+#.#######^^^^"; DG;
PRINT " "; USING "+#.######^^^^"; DG;
PRINT #1, " "; USING "+#.#######^^^^"; R
PRINT " "; USING "+#.######^^^^"; R
RE = RE + 1
IF ABS(DG) <.0000000105# THEN GOTO 40
NEXT I
40 WE$ = "DERIVADA CALCULADA NO PONTO _______ "
PRINT #1, WE$; USING "+#.#############^^^^";
FNDG(C): PRINT #1,
PRINT WE$; USING "+#.#############^^^^"; FNDG(C): PRINT
’
K = K + 1
PRINT "NUM. DE PONTOS:"; K: PRINT "num. de etapas:"; RE:
IF K > 9 THEN GOTO 48
PRINT #1, CHR$(12): PRINT #1, CHR$(14); F$:
PRINT #1, : PRINT #1,
NEXT J
48 CLOSE #1
END
•C •V •A •Ṕ •T •Ṕ. 341 •Ú •S
Tabela B.1: Ilustração de incrementos da função G(x) = 0,2 cos(6,5x)ex , em x0 = 0,
onde: G(x0 ) = −0,2, sendo a derivada local igual a +0,2 (a igualdade numérica entre
o ponto do domínio e o valor local da função é, nesse caso, mera casualidade)
∆x
+1.6000000×10+01
+8.0000000×10+00
+4.0000000×10+00
+2.0000000×10+00
+1.0000000×10+00
+5.0000000×10−01
+2.5000000×10−01
+1.2500000×10−01
+6.2500000×10−02
+3.1250000×10−02
+1.5625000×10−02
+7.8125000×10−03
+3.9062500×10−03
+1.9531250×10−03
+9.7656250×10−04
+4.8828125×10−04
+2.4414063×10−04
+1.2207031×10−04
+6.1035156×10−05
∆G
∆G/∆x
−1.6827950×10+06 −105174.6848984
−9.7373734×10+01
−12.1717167
+6.8641196×10+00
+1.7160299
+1.1410350×10+00
+0.5705175
+3.3092808×10−01
+0.3309281
−5.2780855×10−01
−1.0556171
−2.1391296×10−01
−0.8556519
−4.4150034×10−02
−0.3532003
−4.4291287×10−03
−0.0708661
+2.1063490×10−03
+0.0674032
+2.1027042×10−03
+0.1345731
+1.3087792×10−03
+0.1675237
+7.1806064×10−04
+0.1838235
+3.7485833×10−04
+0.1919275
+1.9137470×10−04
+0.1959677
+9.6672286×10−05
+0.1979848
+4.8582195×10−05
+0.1989927
+2.4352588×10−05
+0.1994964
+1.2191663×10−05
+0.1997482
•C •V •A •Ṕ •T •Ṕ. 342 •Ú •S
+3.0517578×10−05 +6.0996738×10−06
+0.1998741
+1.5258789×10−05 +3.0507974×10−06
+0.1999371
+7.6293945×10−06 +1.5256388×10−06
+0.1999685
+3.8146973×10−06 +7.6287943×10−07
+0.1999843
+1.9073486×10−06 +3.8145472×10−07
+0.1999921
+9.5367432×10−07 +1.9073111×10−07
+0.1999961
+4.7683716×10−07 +9.5366494×10−08
+0.1999980
+2.3841858×10−07 +4.7683481×10−08
+0.1999990
+1.1920929×10−07 +2.3841799×10−08
+0.1999995
+5.9604645×10−08 +1.1920914×10−08
+0.1999998
+2.9802322×10−08 +5.9604608×10−09
+0.1999999
+1.4901161×10−08 +2.9802313×10−09
+0.1999999
+7.4505806×10−09 +1.4901159×10−09
+0.2000000
+3.7252903×10−09 +7.4505802×10−10
+0.2000000
A derivada local é igual a +0,2
•C •V •A •Ṕ •T •Ṕ. 343 •Ú •S
Tabela B.2: Ilustração de incrementos da função G(x) = 0,2 cos(6,5x)ex , em
x0 = 0,50 , onde: G(x0 ) = −0,327808548558, sendo a derivada local igual a
−0,09590984296578
∆x
∆G
+01
+06
+1.6000000×10
+8.0000000×10+00
+4.0000000×10+00
+2.0000000×10+00
+1.0000000×10+00
+5.0000000×10−01
+2.5000000×10−01
+1.2500000×10−01
+6.2500000×10−02
+3.1250000×10−02
+1.5625000×10−02
+7.8125000×10−03
+3.9062500×10−03
+1.9531250×10−03
+9.7656250×10−04
+4.8828125×10−04
+2.4414063×10−04
+1.2207031×10−04
+6.1035156×10−05
∆G/∆x
+2.6562098×10 +166013.1111373
+2.6452836×10+02
+33.0660451
−9.7652107×10+00
−2.4413027
−1.7594419×10+00
−0.8797209
−5.2154306×10−01
−0.5215431
+8.5873663×10−01
+1.7174733
+3.9635503×10−01
+1.5854201
+1.0171416×10−01
+0.8137133
+2.2267068×10−02
+0.3562731
+3.9731680×10−03
+0.1271414
+2.2773166×10−04
+0.0145748
−3.2001170×10−04
−0.0409615
−2.6763006×10−04
−0.0685133
−1.6060837×10−04
−0.0822315
−8.6987994×10−05
−0.0890757
−4.5163107×10−05
−0.0924940
−2.2998599×10−05
−0.0942023
−1.1603532×10−05
−0.0950561
−5.8278203×10−06
−0.0954830
•C •V •A •Ṕ •T •Ṕ. 344 •Ú •S
+3.0517578×10−05 −2.9204233×10−06
−0.0956964
+1.5258789×10−05 −1.4618399×10−06
−0.0958031
+7.6293945×10−06 −7.3132699×10−07
−0.0958565
+3.8146973×10−06 −3.6576525×10−07
−0.0958832
+1.9073486×10−06 −1.8290807×10−07
−0.0958965
+9.5367432×10−07 −9.1460394×10−08
−0.0959032
+4.7683716×10−07 −4.5731787×10−08
−0.0959065
+2.3841858×10−07 −2.2866291×10−08
−0.0959082
+1.1920929×10−07 −1.1433245×10−08
−0.0959090
+5.9604645×10−08 −5.7166473×10−09
−0.0959094
+2.9802322×10−08 −2.8583299×10−09
−0.0959096
+1.4901161×10−08 −1.4291665×10−09
−0.0959097
+7.4505806×10−09 −7.1458361×10−10
−0.0959098
A derivada local é igual a −0,09590984296578
•C •V •A •Ṕ •T •Ṕ. 345 •Ú •S
Apêndice C
Notação de índice e de somatório
Temos notado o aproveitamento do estudante quando se estabelecem as bases para a
notação de somatório mais formalmente, esta é a motivação deste apêndice.
C.1.
Notação de índice
A notação de índice traduz o elemento genérico de uma seqüência, mais detalhadamente: seja IN ⊂ N o conjunto dos N primeiros números naturais (não se inclui o zero),
•C •V •A •Ṕ •T •Ṕ. 346 •Ú •S
i.e., IN = {1, 2, . . . , N−1, N}, e seja um conjunto A não-vazio qualquer; a função
s : IN → A
é chamada seqüência, e denotamos y = s(i), onde i ∈ IN , por yi , i.e., yi = s(i) ∈ A.
A seqüência s : IN → A pode ser expressa por meio da N–upla
y = (y1 , y2 , . . . , yN−1 , yN ) ,
que é diferente do conjunto s[IN ].
Um alerta. Alguns autores se referem a uma seqüência como elementos de uma
conjunto, neste caso precisamos tomar alguns cuidados quanto a nomenclatura, principalmente quando se tem em mente somatórios. Em Teoria dos Conjuntos, os conjuntos
(as coleções)
A = {a, b, c, a, d} e B = {a, b, c, d}
são iguais, uma vez que A ∪ B = A ∩ B = B.
Quando se diz “um conjunto de dados” ou “uma bateria de dados”, está-se referindo, por exemplo, a:
C = {(1, a), (2, b), (3, c), (4, a), (5, d)} ,
note-se que (1, a) , (4, a); ou, de modo mais geral, para os resultados de uma bateria de
N medidas:
D = (1, q1 ), (2, q2 ) . . . (N, qN ) .
Esse conjunto está naturalmente associado com a seqüência:
q = q1 , q2 , . . . , qN .
•C •V •A •Ṕ •T •Ṕ. 347 •Ú •S
C.1.1.
Notação de somatório
Quando se está trabalhando diretamente com poucos dados de uma seqüência de
elementos de um corpo e de modo não apenas simbólico, como por exemplo: q1 =
150,3 cm, q2 = 150,2 cm e q3 = 151,5 cm, não há desconforto em os escrever a cada
momento, assim, a soma desses três números será (em termos da mesma unidade):
150,3 + 150,2 + 151,5 = 452,0 (cm) ,
mas isso pode ser escrito simbólica e compactamente da seguinte maneira:1
3
X
qk = qk=1 + qk=2 + qk=3
k=1
= q1 + q2 + q3
= 150,3 + 150,2 + 151,5
= 452,0 cm
1 O que se está a indicar é o procedimento implícito na notação relativamente ao conjunto bruto de dados.
Note-se que o conjunto bruto de dados pode conter dados em unidades diferentes, nesse caso não poderíamos comparar apenas os dados “numéricos” (brutos), abstraindo-se, temporariamente a unidade e a
grandeza física, por exemplo
q1 = 150,3 cm = 15,03 dm = 1503 mm .
Para usar o “valor numérico” de q1 conjuntamente ao de q2 e q3 não se pode levar o “número bruto” 15,03
ou 1503, uma vez que se referem a unidades distintas, há que considerar 150,3, ou seja, levar todos os dados
brutos à mesma unidade.
•C •V •A •Ṕ •T •Ṕ. 348 •Ú •S
e lido como somatório de q índice k com k variando de 1 a 3.
Com referência à seqüência genérica q, a soma S de todas as medidas consideradas
será expressa compactamente por:
S=
N
X
qk = qk=1 + qk=2 + . . . + qk=N
k=1
= q1 + q2 + . . . + qN
de modo que o índice k é um dos primeiro elemento dos pares (k , qk ) ∈ D, i.e., k ∈
{1, 2 . . . N}.
•C •V •A •Ṕ •T •Ṕ. 349 •Ú •S
C.1.2.
Principais propriedades do somatório
Listamos a seguir as principais propriedades envolvendo somatórios em um corpo.
N
X
i=1
N
X
N
X
(a xi ) = a
xk
k=1
1=N
i=1
N N
X X
y j
xi + yi =
xi +
N
X
i=1
N
X
j=1
i=1
xi =
i=1
M
X
i=1
xi +
N
X
xi ,
onde M < N
i=M+1
N N
N
X X X
xi
y j =
xi y j
i=1
j=1
i,j=1
. A primeira identidade traduz a distributividade da multiplicação de números
reais em relação à adição.
. A segunda identidade indica a soma de N parcelas iguais a 1.
•C •V •A •Ṕ •T •Ṕ. 350 •Ú •S
. A terceira identidade traduz a comutatividade e a associatividade da adição de
números reais.
. A quarta identidade traduz um outro aspecto da associatividade da adição de
números reais.
. A quinta, e última, segue-se diretamente da distributividade da multiplicação em
relação a adição.
O termo “somatório” significa o resultado da adição indicada.
•C •V •A •Ṕ •T •Ṕ. 351 •Ú •S
Apêndice D
Funções homogêneas
D.1.
Definição de função homogênea (Euler)
Dizemos que a função F(x1 , x2 . . . xκ ; α1 , α2 . . . αs ) é homogênea de grau n ∈ Z (de homogeneidade) nas κ variáveis x se, para qualquer real λ,
F(λx1 , λx2 . . . λxκ ; α1 , α2 . . . αs ) = λn F(x1 , x2 . . . xκ ; α1 , α2 . . . αs ) .
•C •V •A •Ṕ •T •Ṕ. 352 •Ú •S
D.2.
O teorema de Euler
Teorema D.2.1 (de Euler para funções homogêneas).
Se F(x1 , x2 . . . xκ ; α1 , α2 . . . αs ) é homogênea de grau n (de homogeneidade) nas variáveis x,
então
κ
X
∂F
xi = n F(x1 , x2 . . . xκ ; α1 , α2 . . . αs ) .
∂xi
i=1
Prova. Usando-se a notação:
x = (x1 , x2 . . . xκ ) ,
λx = (λx1 , λx2 . . . λxκ )
e α = (α1 , α2 . . . αs ) ,
tira-se da hipótese:
i ∂F h
i∂ h
i
∂ h
F(λx; α) =
λn F(x; α)
F(λx; α) = n λn−1 F(x; α)
∂λ
∂λ
∂λ
κ
X
h
i ∂(λxi )
∂
F(λx; α)
= n λn−1 F(x; α)
∂(λxi )
∂λ
i=1
portanto
κ
X
i=1
xi
h
i
∂
F(λx; α) = n λn−1 F(x; α) .
∂(λxi )
•C •V •A •Ṕ •T •Ṕ. 353 •Ú •S
A última relação é válida, por hipótese, para todo λ real; em particular, para λ = 1, daí:
κ
X
i=1
D.3.
xi
i
∂ h
F(x; α) = n F(x; α) .
∂xi
Outros teoremas envolvendo
funções homogêneas
A proposição inversa ao teorema de Euler também é útil:
Teorema D.3.1. Se F(x; α) = F(x1 , x2 . . . xκ ; α1 , α2 . . . αs ) é uma função tal que
κ
X
∂F
xi = n F(x; α) ,
∂xi
i=1
então F(x; α) é uma função homogênea de grau n (de homogeneidade) nas variáveis x.
Prova. Vamos provar por negação. Se F(x; α) não é uma função homogênea de grau n,
então
F(λx; α) , λn F(x; α) ,
portanto, aplicando o mesmo procedimento da prova do teorema de Euler à desigualdade anterior,
κ
X
h
i
∂
F(λx; α) , n λn−1 F(x; α)
∀λ ∈ R ,
xi
∂(λxi )
i=1
•C •V •A •Ṕ •T •Ṕ. 354 •Ú •S
o que contradiz a hipótese.
Outra proposição importante para funções homogêneas:
Teorema D.3.2. Se F(x; α) = F(x1 , x2 . . . xκ ; α1 , α2 . . . αs ) é uma função C2 e homogênea de grau
n, então cada função F,i = ∂F/∂xi é uma função homogênea de grau (n−1).
Prova. Se F(λx; α) = λn F(x; α), então, pelo teorema de Euler,
κ
X
∂F
j−1
⇒
∂x j
xj = n F
⇒
κ
X
∂2 F
∂F
∂F
xj +
δij = n
∂xi ∂x j
∂x j
∂xi
j−1
κ
X
∂2 F
∂F
x j = (n − 1)
, como F ∈ C2
∂xi ∂x j
∂xi
j−1
!
!
κ
X
∂
∂F
∂F
x j = (n − 1)
∀j ∈ Iκ ,
∂x j ∂xi
∂xi
j−1
portanto a proposição se segue do teorema D.3.1.
É fácil demonstrar a seguinte proposição:
•C •V •A •Ṕ •T •Ṕ. 355 •Ú •S
Teorema D.3.3. Se F1 (x; α), F2 (x; α) e F3 (x; α) são funções homogêneas de graus n1 , n2 e n3 ,
definidas no mesmo domínio sobre contradomínios não-disjuntos, então F(x; α) = F1+F2 F3
é uma função homogênea de grau n1 , se n2 +n3 = n1 .
D.4.
Exemplos de função homogênea
Deve-se destacar com ênfase que todas as leis Físicas e toda grandeza Física são expressas por funções homogêneas, no sentido de Euler, com grau de homogeneidade
bem caracterizada nas grandezas fundamentais (p.ex., as grandezas associadas com as
unidades de base do SI); caso contrário seria inaplicável a adoção de um sistema de
unidades coerentes (como o SI), bem como qualquer procedimento metrológico e de
tratamento de dados para estimativa de medidas e incertezas.
Listamos a seguir alguns exemplos de funções homogêneas, cujo grau de homogeneidade pode ser verificado pelo leitor, bem como ao conjunto mínimo de variáveis
para a qual a função é homogênea.
(a)
Fa (x1 , x2 ) = (aa x1 + ba x2 )na
(b)
Fb (x1 , x2 ) = ab x1 e(bb x1 /x2 )
(c)
Fc (x1 , x2 ) = ac xn2 c cos(bc x1 /x2 )
(d)
Fd (x1 , x2 ) = Fa + Fb Fc , se na = nb + nc
•C •V •A •Ṕ •T •Ṕ. 356 •Ú •S
(e)
Fe (x1 , x2 ) =
∂
∂x1 Fb
= (1 − x1 /x2 ) ex1 /x2
(f)
F f (x1 , x2 ) =
∂
∂x2 Fb
= − (x1 /x2 )2 ex1 /x2
(g)
F g (x1 , x2 ) = a g x1 e(bg x2 /x1 ) .
•C •V •A •Ṕ •T •Ṕ. 357 •Ú •S
Apêndice E
Gráficos de algumas funções
Acrescentamos neste apêndice gráficos de algumas funções importantes que esperamos
sejam úteis para os estudantes. Esses gráficos foram obtidos em formatos EPS (e PDF)
por meio do MAPLE; futuramente os programaremos em LATEX 2ε nativo.
•C •V •A •Ṕ •T •Ṕ. 358 •Ú •S
Figura E.1: Gráfico da função inversa, y = 1/x
6
4
y
2
–6
–4
–2
0
2
x
4
6
–2
–4
–6
•C •V •A •Ṕ •T •Ṕ. 359 •Ú •S
Figura E.2: Gráfico da função inversa, y = 1/x (detalhe)
5
4
3
y
2
1
0
1
2
x
3
4
5
•C •V •A •Ṕ •T •Ṕ. 360 •Ú •S
Figura E.3: Gráfico da função seno, y = sen(x)
1
0.5
0
-0.5
-1
-10
-8
-6
-4
-2
0
2
4
6
8
10
•C •V •A •Ṕ •T •Ṕ. 361 •Ú •S
Figura E.4: Gráfico da função cosseno, y = cos(x)
1
0.5
0
-0.5
-1
-10
-8
-6
-4
-2
0
2
4
6
8
10
•C •V •A •Ṕ •T •Ṕ. 362 •Ú •S
Figura E.5: Gráfico da função tangente, y = tan(x)
6
4
y
2
–8
–6
–4
–2
0
2
4
6
8
x
–2
–4
–6
•C •V •A •Ṕ •T •Ṕ. 363 •Ú •S
Figura E.6: Gráfico da função cotangente, y = ctg(x)
6
4
y
2
–8
–6
–4
–2
0
2
4
6
8
x
–2
–4
–6
•C •V •A •Ṕ •T •Ṕ. 364 •Ú •S
Figura E.7: Gráfico da função secante, y = sec(x)
6
4
y
2
–6
–4
–2
0
2
x
4
6
–2
–4
–6
•C •V •A •Ṕ •T •Ṕ. 365 •Ú •S
Figura E.8: Gráfico da função cossecante, y = csc(x)
6
4
y
2
–6
–4
–2
0
2
x
4
6
–2
–4
–6
•C •V •A •Ṕ •T •Ṕ. 366 •Ú •S
Figura E.9: Gráfico do arco seno, y = arcsen(x)
2
y 1
–1
–0.5
0
0.5
x
1
–1
–2
•C •V •A •Ṕ •T •Ṕ. 367 •Ú •S
Figura E.10: Gráfico do arco cosseno, y = arccos(x)
3
2
y
1
–1
–0.5
0
0.5
x
1
•C •V •A •Ṕ •T •Ṕ. 368 •Ú •S
Figura E.11: Gráfico do arco tangente, y = arctan(x)
2
y 1
–6
–4
–2
0
2
x
4
6
–1
–2
•C •V •A •Ṕ •T •Ṕ. 369 •Ú •S
Figura E.12: Gráfico do arco tangente, y = arccot(x)
3
2
y
1
–6
–4
–2
0
2
x
4
6
•C •V •A •Ṕ •T •Ṕ. 370 •Ú •S
Figura E.13: Gráfico do arco secante, y = arcsec(x)
3
2
y
1
–6
–4
–2
0
2
x
4
6
•C •V •A •Ṕ •T •Ṕ. 371 •Ú •S
Figura E.14: Gráfico do arco cossecante, y = arccsc(x)
1
y
–6
–4
–2
2
x
4
6
–1
•C •V •A •Ṕ •T •Ṕ. 372 •Ú •S
Figura E.15: Gráfico do quadrado do seno e do cosseno, y = sen2 (x) e y = cos2 (x); reconheça no
gráfico essas funções e mais cos(x) ou sen(x)
1
y 0.5
–1.4 –1.2
–1
–0.8 –0.6 –0.4 –0.2 0
0.2
0.4
0.6
0.8
x
1
1.2
1.4
•C •V •A •Ṕ •T •Ṕ. 373 •Ú •S
Figura E.16: Gráfico do seno hiperbólico, y = senh(x)
20
y
10
–4
–2
2
x
4
–10
–20
•C •V •A •Ṕ •T •Ṕ. 374 •Ú •S
Figura E.17: Gráfico do cosseno hiperbólico, y = cosh(x)
8
7
6
5
y
4
3
2
1
–2
–1
0
1
x
2
•C •V •A •Ṕ •T •Ṕ. 375 •Ú •S
Figura E.18: Gráfico da tangente hiperbólica, y = tanh(x)
1
y 0.5
–4
–2
2
x
4
–0.5
–1
•C •V •A •Ṕ •T •Ṕ. 376 •Ú •S
Figura E.19: Gráfico da cotangente hiperbólica, y = coth(x)
20
y 10
–4
–2
0
2
x
4
–10
–20
•C •V •A •Ṕ •T •Ṕ. 377 •Ú •S
Alfabeto grego
alfa
beta
gama
delta
epsilon
zeta (ou dzeta)
eta
teta
iota
capa
lambda
mi (ou mu)
ni (ou nu)
csi (ou xi)
ômicron
pi
rô
sigma
tau
ípsilon
fi
qui (ou chi)
psi
ômega
minúscula
α
β
γ
δ
, ε
ζ
η
θ, ϑ
ι
κ
λ
µ
ν
ξ
o
π,$
ρ, %
σ,ς
τ
υ
φ, ϕ
χ
ψ
ω
maiúscula
A
B
Γ
∆
E
Z
H
Θ
I
K
Λ
M
N
Ξ
O
Π
P
Σ
T
Υ
Φ
X
Ψ
Ω
O sombreado indica letra grega de pouco uso
•C •V •A •Ṕ •T •Ṕ. 378 •Ú •S
•C •V •A •Ṕ •T •Ṕ. 379 •Ú •S
Figuras
1.1
Coordenadas polares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1
2.2
2.3
2.4
2.5
2.6
2.7
Uma reta no plano xOy . . . . . . . . . . . . . . . . . . . . . . . . .
Teorema de Pitágoras . . . . . . . . . . . . . . . . . . . . . . . . . .
O ângulo central . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Ilustração para uma rotação de eixos . . . . . . . . . . . . . . . . . .
Ilustração para a lei do cosseno e para a lei dos senos . . . . . . . .
Triângulo ABC e seu círculo circunscrito com centro em O e reio R.
Gráfico de uma função do segundo grau . . . . . . . . . . . . . . .
3.1
Sistema de coordenadas para as equações das cônicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233
4.1
4.2
Tangente e normal a uma curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
Patologias para a base de Frenet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
31
133
135
137
149
170
174
206
E.1 Gráfico da função inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359
•C •V •A •Ṕ •T •Ṕ. 380 •Ú •S
E.2
E.3
E.4
E.5
E.6
E.7
E.8
E.9
E.10
E.11
E.12
E.13
E.14
E.15
E.16
E.17
E.18
E.19
Gráfico da função inversa (detalhe) . . . . .
Gráfico da função seno . . . . . . . . . . . .
Gráfico da função cosseno . . . . . . . . . .
Gráfico da função tangente . . . . . . . . .
Gráfico da função cotangente . . . . . . . .
Gráfico da função secante . . . . . . . . . .
Gráfico da função cossecante . . . . . . . .
Gráfico do arco seno . . . . . . . . . . . . .
Gráfico do arco cosseno . . . . . . . . . . .
Gráfico do arco tangente . . . . . . . . . . .
Gráfico do arco tangente . . . . . . . . . . .
Gráfico do arco secante . . . . . . . . . . . .
Gráfico do arco cossecante . . . . . . . . . .
Gráfico do quadrado do seno e do cosseno
Gráfico do seno hiperbólico . . . . . . . . .
Gráfico do cosseno hiperbólico . . . . . . .
Gráfico da tangente hiperbólica . . . . . . .
Gráfico da cotangente hiperbólica . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
•C •V •A •Ṕ •T •Ṕ. 381 •Ú •S
Tabelas
1.1
1.2
1.3
1.4
Tabuada para um grupo de ordem 3 . . . .
Tabuadas para grupos de ordem 4 . . . . .
Tabuadas para o corpo ({0, 1}, ⊕, ) . . . . .
Tabuada para o corpo ({1, 0, 1}, ⊕, ) . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
59
60
72
72
B.1 Tabela ilustrativa para a derivada de uma função . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342
B.2 Tabela ilustrativa para a derivada de uma função . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
Alfabeto grego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 378
•C •V •A •Ṕ •T •Ṕ. 382 •Ú •S
Referências
[1] G. Birkhoff and S. MacLane, Álgebra moderna básica, 4th ed., Guanabara Dois, Rio de
Janeiro, 1980, (1977).
[2] H. B. Callen, Thermodynamics and an introduction to thermostatistics, second ed., John Wiley,
NY, 1985, (fourth printing, 1987).
[3] B. J. Caraça, Conceitos fundamentais da matemática, 9a¯ ed., Livraria Sá da Costa Editora,
Lisboa, 1989.
[4] M. P. do Carmo, Elementos de geometria diferencial, Ao Livro Técnico, Rio de Janeiro, 1971.
[5] B. Castrucci, Elementos de teoria dos conjuntos, Livraria Nobel, SP, 1970.
[6] S. H. Chue, Thermodynamics, a rigorous postulatory approach, John Wiley, Chichester, 1977.
[7] A. Einstein, Os fundamentos da teoria relatividade geral, Ann. d. Phys. 49 (1916), «Pode ser
encontrado em [20]».
[8] A. Fonseca, Curso de mecânica, dinâmica, vol. III, Ao Livro Técnico, Rio de Janeiro, 1971.
•C •V •A •Ṕ •T •Ṕ. 383 •Ú •S
[9] A. Gonçalves, Introdução à Álgebra, IMPA–CNPq, Rio de Janeiro, 1979.
[10] W. A. Granville, P. F. Smith, and W. R. Longley, Elementos de cálculo diferencial e integral,
Editora Científica, Rio de Janeiro, 1961.
[11] P. R. Halmos, Teoria ingênua dos conjuntos, Ed. USP – Polígono, SP, 1970, (1960).
[12]
, Finite-dimensional vector spaces, Spring–Verlag, NY, 1974, (1958).
[13] F. B. Hildebrand, Advanced calculus, Prentice–Hall, Englewood Cliffs, 1962.
[14] H. P. Hsu, Análise vetorial, Livros Técnicos e Científicos, Rio de Janeiro, 1972.
[15] W. Kaplan, Advanced calculus, Addison–Wesley, Reading, 1952.
[16] M. L. Krasnov, A. I. Kisseliov, and G. I. Makarenko, A análise vetorial, Editora Mir, Moscou,
1981.
[17] S. Lang, Cálculo, vol. 1, Ao Livro Técnico, Rio de Janeiro, 1971.
[18] E. L. Lima, Curso de análise, vol. 1, IMPA–CNPq, Rio de Janeiro, 1976.
[19]
, Curso de análise, vol. 2, IMPA–CNPq, Rio de Janeiro, 1981.
[20] H. A. Lorentz, A. Einstein, and H. Minkowski, O princípio da relatividade, Textos
Fundamentais da Física Moderna, vol. 1, Fundação Calouste Colbenkian, Lisboa, 1978.
[21] L. P. M. Maia, Mecânica vetorial, UFRJ, Rio de Janeiro, 1984.
[22] W. A. Mauer, Curso de cálculo diferencial e integral, vol. 1–4, Blücher, SP, 1967.
[23] MiKTeX, MiKTEX, 2004, www.miktex.org.
[24] E. E. Moise, Elements of calculus, 2nd ed., Addison–Wesley, Reading, 1972.
[25] L. Nachbin, Algebra elemental, Programa Regional de Desarrollo Científico y Tecnológico,
série de matemática, OEA, Washington, 1986, Monografia no¯ 26.
•C •V •A •Ṕ •T •Ṕ. 384 •Ú •S
[26] A. V. Pogorélov, Geometria diferencial, Mir, Moscoú, 1974.
[27] Ju. A. Schreider, Equality, resemblance and order, Mir, Moscow, 1972.
[28] A. Sommerfeld, Mechanics, Academic Press, NY, 1942.
[29] K. R. Symon, Mechanics, 3th ed., Addison–Wesley, Reading, 1971.
[30] J. L. Synge, Classical dynamics, Encyclopædia of Physics, vol. III/1, Spring–Verlag, Berlin,
1960.
[31] J. L. Synge and B. A. Griffith, Principles of mechanics, 3th ed., McGraw–Hill, NY, 1959.
[32] Armando Dias Tavares, Física (sumários), vol. II, UERJ, Rio de Janeiro, 1977, «trabalho
sendo revisado e adaptado para formato de livro; versão atualizada disponível em
www.dft.if.uerj.br/umberto».
[33] TUG, TEX User Grup, 2001, www.tug.org.
[34] B. G. Wachsmuth, www.shu.edu/projects/reals/, may 2000.
[35] E. T. Whittaker, A treatise on the analytical dynamics of particles and rigid bodies, with an
introduction do the problem of three bodies, 4th ed., Cambridge University Press, printed in
USA, 1961, (1937).
•C •V •A •Ṕ •T •Ṕ. 385 •Ú •S
Índice Remissivo
0, 69, 71
1, 70, 71
2, 82
<, 86
>, 86
≥, 88, 89
≤, 88
e, 184, 187, 189
Cn , 192
i, 116, 208
aceleração, 271, 282, 286, 290
em coord. cilíndricas, 274, 275
em coord. esféricas, 278
adição, 61, 71, 117, 208, 333
de frações, 76
de matrizes, 63
afélio, 239
álgebra
elementar, 179
linear, 90, 203
amplitude, 26
anel, 70
ângulos
côngruos, 58, 59, 144
aplicação, 33
aproximação
•C •V •A •Ṕ •T •Ṕ. 386 •Ú •S
em primeira ordem, 201
linear, 200
apsides, 239
arco
capaz, 136, 138, 173
cossecante, 162
cosseno, 162
cotangente, 162
secante, 162
seno, 161
tangente, 162
área
do triângulo, 173
argumento, 145
cossecante hiperbólica, 227
cosseno
hiperbólico, 225
cotangente hiperbólica, 226
secante hiperbólica, 227
seno hiperbólico, 224
tangente hiperbólica, 225
associatividade, 37, 42, 50, 102, 107, 108
automorfismo, 48
axiomas de
corpo, 69
espaço vetorial, 107, 108
grupo, 50
Peano, 116, 332
base, 177
de Frenet, 287
direta, 317
dos logaritmos naturais, 184
local, 264
normalizada, 265
recíproca, 266
batimento, 154
Bhaskara, 84
bijeção, 36, 64, 110, 160, 183, 295
binormal, 286, 290
campo
atrativo, 252
de força, 298, 300
elétrico, 298
escalar, 296, 315
gravitacional, 298
magnético, 298
repulsivo, 252
vetorial, 297, 305, 315
carga elétrica, 297
•C •V •A •Ṕ •T •Ṕ. 387 •Ú •S
cateto, 134
centro
do círculo, 286
classe
de equivalência, 28–31, 59, 255
coeficiente
angular, 132
comensurabilidade, 129
comensurável, 129
complexificação, 217
complexo
conjugado, 120
componente
binormal
do sacolejo, 293
normal
da aceleração, 293
do sacolejo, 293
ortogonal, 146
tangencial
da aceleração, 292
do sacolejo, 293
comprimento de arco, 281
comutatividade, 42, 104, 107
configuração, 202
de equilíbrio, 202
conjunto
das partes, 28
imagem, 34
quociente, 29
vazio, 25
constante
elástica, 202
contagem, 36
contradomínio, 32
coordenadas
cilíndricas, 272, 276
curvilíneas, 253
esféricas, 276
ortogonais, 267
parabólicas, 278
polares, 158
corpo, 69, 350
dos complexos, 86, 91, 117
dos reais, 91, 124
ordenado, 85, 86
cossecante, 156, 158
hiperbólica, 220
inversa, 227
cosseno, 141, 143, 158
•C •V •A •Ṕ •T •Ṕ. 388 •Ú •S
da soma, 151, 215
hiperbólico, 219
da soma, 221
inverso, 225
trigonométrico, 141
cotangente, 156, 158
hiperbólica, 220
da soma, 221
inversa, 226
curva, 256
curva–coordenada, 259, 264
curvatura, 283
círculo, 232, 243, 244, 286
cônica, 232
definição, 104, 107
função exponencial, 186, 187
gradiente, 307
demonstração
por indução, 333
densidade, 297
dependência
linear, 95
derivada, 201, 205, 339
da função
composta, 189
exponencial, 188
inversa, 164
logaritmo, 187
das funções
hiperbólicas, 223, 228
de função
par, 127
periódica, 130
ímpar, 127
direcional, 305, 310
do arco cosseno, 165
do arco seno, 165
do arco tangente, 166
do cosseno, 166, 216
do seno, 166, 216
desigualdade, 86
do triângulo, 90, 121
determinante, 98
diferença, 74
diferencial, 200, 303
de uma função
de uma variável, 201
de várias variáveis, 201
direção do gradiente, 310
diretriz, 232, 241
•C •V •A •Ṕ •T •Ṕ. 389 •Ú •S
discriminante, 203
distributividade, 70, 108
distância, 296
divergente, 315
divisão, 74, 81
domínio, 25, 32
simétrico, 125
elemento
de área, 314
negativo, 85
neutro, 43, 50, 102, 107, 119, 124
à direita, 42, 102
à esquerda, 42, 102
não-negativo, 85
positivo, 85
simétrico, 51, 103, 107
elipse, 232, 243
energia
cinética, 278
potencial, 202, 297
equação, 52, 124
cartesiana
da elipse, 240
da hipérbole, 246, 247, 250
da parábola, 245
do círculo, 244
diferencial, 189
do primeiro grau, 92
do segundo grau, 81
geral das cônicas
em coord. cartesianas, 238
em coord. polares, 234
paramétrica, 132, 260
de uma curva, 256
polar
da elipse, 240
da hipérbole, 246
da parábola, 244
do círculo, 244
eqüipolência, 103
escalar, 48, 107, 146, 296
espaço
vetorial, 108, 125, 207, 217
estrutura
algébrica, 50
Euler, 212
excentricidade, 232
relativa, 250
expoente, 67, 177
exponencial
•C •V •A •Ṕ •T •Ṕ. 390 •Ú •S
complexa, 212
extensão, 33
fasor, 207, 218
fluxo, 313
foco, 232, 240
força
de Lorentz, 300
elástica, 202
forma positiva definida, 119
Frenet, 279
função, 32
afim, 131
algébrica, 191
analítica, 196, 199
biunívoca, 36
composta, 37, 111
constante, 35
de várias variáveis, 199
do primeiro grau, 131, 200
do segundo grau, 200
exponencial, 183
homogênea, 352, 356
identidade, 35
inclusão, 35
injetiva, 35, 125, 179, 264
inversa, 36, 125
à direita, 39
à esquerda, 38
linear, 131
monótona, 183
módulo, 88
par, 124, 126, 127, 154, 158, 205, 221
periódica, 124, 125, 158–160
produto, 124
sobrejetiva, 35
soma, 125
transcendente, 191
valor absoluto, 88
ímpar, 124, 126, 127, 154, 158, 221
funções
circulares, 220
hiperbólicas, 220
trigonométricas, 220
fórmula
de Euler, 212
de Frenet, 279, 289
de Moivre, 213
gradiente, 199, 307
em coordenadas
cartesianas, 307
•C •V •A •Ṕ •T •Ṕ. 391 •Ú •S
esféricas, 308
grupo, 50, 69, 70, 180
abeliano, 68
aditivo, 63
comutativo, 68, 104, 107
de ordem infinita, 57
de rotações no plano, 217
de transformações, 64
finito, 56, 57
infinito, 57, 61
multiplicativo, 63
não-abeliano, 68
não-comutativo, 68
indução
matemática, 65, 214, 333
injeção, 35, 183
integração
por partes, 193
inverso, 70, 81
multiplicativo, 117, 118
isomorfismo, 48, 67, 111, 112, 180, 191, 217
iterada, 333
hipotenusa, 134, 139
hipérbole, 232, 249
homomorfismo, 48
Lagrange, 50
laplaciano, 325
lei
do corte, 53
à direita, 53
à esquerda, 53
do cosseno, 171
dos senos, 173, 176
física, 48, 356
zero da termodinâmica, 28
Levi-Civita, 317
linearização, 200
igualdade, 27, 103
entre conjuntos, 30
entre funções, 33
imagem
da função, 34
ímpar, 334, 336
incerteza, 356
índice, 110
jacobiano, 263, 266
Kepler, 252
•C •V •A •Ṕ •T •Ṕ. 392 •Ú •S
logaritmo, 179
natural, 182
neperiano, 179, 182
lugar
geométrico, 136
lugar geométrico, 250, 255
maior
do que, 86
ou igual, 88
massa, 297
matriz
identidade, 96
singular, 98
mediatriz, 286
medida, 356
menor
do que, 86
ou igual, 88
metrologia, 356
Moivre, 213
monotonia
da adição, 87
da multiplicação, 87
mudança
de base, 181
multiplicação, 71, 117, 334
módulo, 89
norma, 119
notação, 91, 110, 113
exponencial, 36, 73, 177
matricial, 96
número
complexo, 72, 116
inteiro, 72, 115
natural, 332
racional, 72
real, 72, 116
não-negativo, 85
não-singular, 98
operação, 41
fechada, 41, 50
operador, 217
divergente, 312, 324
laplaciano, 325, 326
nabla, 312
rotacional, 312, 330
ordem
do grupo, 56
•C •V •A •Ṕ •T •Ṕ. 393 •Ú •S
par, 334, 336
paralelismo, 141
parte
imaginária, 119, 215
real, 119, 215
partição, 29
parábola, 232, 244, 245
parâmetro, 132
da cônica, 234
periélio, 239
período, 124, 159
Pitágoras, 134
plano
osculador, 286, 292
polinômio, 191
positivo, 85
potenciação, 178, 209
princípio da indução, 333
problema, 38, 53, 67, 76, 78, 82, 84, 88, 89, 95,
111, 122, 128, 130, 144, 155, 156, 159,
162, 164, 166, 169, 176, 180, 182, 190,
205, 209, 211, 219, 222, 223, 228, 229,
275, 278, 290, 300, 307, 326, 333, 335
produto, 74
de funções, 125
escalar, 142, 146, 147, 266, 305
notável, 82
vetorial, 175
projeção, 35
ortogonal, 146
quase-coordenada, 255
quociente, 74
racional, 336
radiano, 159, 168
radiciação, 178
raio
de curvatura, 283
de torção, 289
raiz
de uma função, 79, 124, 203
quadrada, 81
ramo
da hipérbole, 249
negativo, 250, 252
positivo, 250, 252
razão
de semelhança, 132, 141
redução
ao primeiro quadrante, 152
•C •V •A •Ṕ •T •Ṕ. 394 •Ú •S
regra
da cadeia, 188, 189
do domínio máximo, 34, 125
do paralelogramo, 103, 104, 208
dos sinais, 75
régua
de cálculo, 181
relação, 25, 177
anti-reflexiva, 26
assimétrica, 26
binária, 25
de equivalência, 27–29, 31, 32, 58, 59, 255
de igualdade, 31, 117
de ordem, 86
inversa, 26
reflexiva, 26
simétrica, 26
transitiva, 27
vazia, 25
representação, 112, 297, 309
polar de complexo, 209
resto
de Lagrange, 196, 200
restrição
de uma função, 33, 302
reta, 132
secante, 280
tangente, 280
rotacional, 327
sacolejo, 290
secante, 156, 158
hiperbólica, 220
hiperbólica inversa, 227
semi-eixo
maior, 243
menor, 243
seno, 141–143, 158
da soma, 151, 215
hiperbólico, 219
da soma, 221
inverso, 224
trigonométrico, 141
seqüência, 347
SI, 159, 356
simétrico, 43, 81, 107
à direita, 43
à esquerda, 43
sistema
algébrico, 24
de coordenadas
•C •V •A •Ṕ •T •Ṕ. 395 •Ú •S
esféricas, 275
de equações lineares, 90
impossível, 94
indeterminado, 94
linear
homogêneo, 95
sobrejeção, 35
solução, 52
geral da equação
do segundo grau, 83
trivial, 95
soma, 74
de funções, 125
somatório, 351
subgrupo, 51
subtração, 73, 74, 81
sucessor, 332
superfície, 257
regular, 259
série
de Taylor, 191, 192, 196, 210
da exponencial, 210
do cosseno, 210
do seno, 210
tabuada, 58, 60, 71
tangente, 141, 143, 158
da soma, 152
hiperbólica, 220
da soma, 221
inversa, 225
trigonométrica, 132, 141
temperatura, 28, 297
tensor, 48, 296
teorema
de Euler, 353
de Gauss, 315, 316
de Lamy, 173, 176
de Pitágoras, 116, 133, 134, 139, 145, 171,
219
de Taylor, 194
de Thales, 138
termodinâmica, 28
termômetro, 28
Thales, 138
torção, 289
transferidor, 141, 147
transformação, 33
ortogonal, 267
transitividade, 86
tricotomia, 86
•C •V •A •Ṕ •T •Ṕ. 396 •Ú •S
triedro de Frenet, 279
triângulos
semelhantes, 132, 140
unidade, 356
imaginária, 119, 208
velocidade
em coord. cilíndricas, 274
em coord. esféricas, 277
versor, 147
tangente à curva, 281
vetor, 48, 146, 296
base, 298
normal, 283
posição, 113, 272, 298
em coord. cartesianas, 272
em coord. cilíndricas, 273
posição
em coord. esféricas, 277
tangente à curva, 257
velocidade, 281
vértice
da cônica, 239
da parábola, 245
•C •V •A •Ṕ •T •Ṕ. 397 •Ú •S
Nota sobre a editoração
Este texto foi processado pelo autor e compilado em LATEX 2ε , usando o MikTEX 2.4.
Alguns dados para as figuras foram obtidos por meio do programa gnuplot 3.71 e os gráficos das funções
usando Maple.
O material deste trabalho está disponível em diversos formatos, todos obtidos dos mesmos arquivosfonte, tendo, portando, o mesmo conteúdo:
1. Impresso em papel;
2. Em formato PS no mesmo molde do impresso;
3. Em formato PDF no mesmo molde do impresso;
4. Em formato PS no mesmo molde do impresso com hiper-referência;
5. Em formato PDF no mesmo molde do impresso com hiper-referência;
6. Em formato PDF com hiper-referência para leitura diretamente do terminal de vídeo, que também se
mostra adequado como material de aula para projeção por “data show”.
Note-se que “hiper-referência” significa aqui total facilidade para “navegação” no texto e para as referências
externas, como endereços eletrônicos, etc.
1 Programa gratuito, ©1986 – 1993 Thomas Williams, Colin Kelley, que pode ser obtido, por exemplo, no endereço:
http://archives.math.utk.edu/software/msdos/graphing/gnuplot/.html .
•C •V •A •Ṕ •T •Ṕ. 398 •Ú •S
•C •V •A •Ṕ •T •Ṕ. 399 •Ú •S