PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL MATRIZES E VETORES 1) CONCEITOS BÁSICOS Os cálculos/operações assim como conceitos envolvendo matrizes e vetores constituem a base dos métodos numéricos que tratam da solução de sistemas lineares e não lineares de equações algébricas ou diferenciais. A representação destes sistemas em termos matriciais/vetoriais é extremamente mais compacta e é corrente na literatura técnica. Como visa-se neste curso apresentar os conceitos básicos deste assunto especialmente relacionados com aplicações em Engenharia Química, os elementos de matrizes e vetores serão em princípio números ou variáveis reais a não ser quando explicitamente especificados como complexos. Uma matriz é um arranjo retangular de números em m linhas e n colunas, m x n, sendo representada como A (letras maiúsculas em negrito) pertencente a m x n, isto é: A mxn . O elemento da linha i e coluna j de A é representado por aij (correspondente letra minúscula com o sub-índice ij ) ou (A)ij . A matriz completa é geralmente escrita na a11 a12 a1n a21 a22 a2 n forma: A ou, am1 am 2 amn em forma mais compacta,por: A aij com i= 1, ..., m e j=1, ...n. Se duas matrizes A e B apresentam o mesmo número de linhas e o mesmo número de colunas são ditas do mesmo tipo. Se A aij é tal que aij = 0 para todo i e j então a matriz A é dita nula e é representada por 0. Se n=m a matriz A é dita quadrada. Se n=m e a ij a ji para i,j = 1, ... n a matriz quadrada A é dita simétrica. Se n=1 tem-se um vetor coluna ou simplesmente vetor designado por v (letra minúscula em v1 v negrito) e representado por: v 2 m vm Se m=1 tem-se um vetor linha designado por vT (letra minúscula em negrito com o sobreíndice T de transposto) e representada por: vT v1 v2 vn 1xn Se m=n=1 tem-se um escalar (real) (letra minúscula grega), ou seja: . A matriz A mxn pode ser particionada por: a) Colunas na forma: 1 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL A a1 a 2 an a1 j a2 j onde a j m para j = 1, ... , n são os n vetores amj colunas da matriz A; b) Linhas na forma: a1T T a A 2 onde aTi ai1 T am linhas da matriz A. ai 2 ain 1xn para i = 1, ... , m são os m vetores 2) OPERAÇÕES ENTRE MATRIZES As operações de adição ou subtração são definidas apenas para matrizes do mesmo tipo, assim se A e B são matrizes (m x n ) então a matriz C , também (m x n ), soma ou subtração de A com B, representada por C = A B, tem como termo geral : cij = aij bij para i = 1, ... , m e j = 1, ... , n . Se é um escalar qualquer, a matriz A é uma matriz cujo termo geral é aij. A operação de multiplicação de matrizes está intimamente relacionada a transformações de coordenadas. Assim sejam as seguintes transformações lineares: n p j 1 k 1 zi aij y j para i = 1, ..., m e y j b jk xk para j = 1, ..., m., expressando zi em temos de xk , por substituição tem-se: n p p n zi aij b jk xk aij b jk xk j 1 k 1 k 1 j 1 n m j 1 k 1 definindo: cik aij b jk tem-se: zi cik xk , o que induz à definição da matriz: C A B onde A é (m,n) , B é (n,p) e C é (m,p) que apresenta como termo geral: n cik aij b jk para i = 1, ..., m e k = 1, ..., p. Verificando-se assim que a operação A B só j 1 é definida se o número de colunas de A (primeira parcela do produto) for igual ao número de linhas de B (segunda parcela do produto). É importante ressaltar que a lei de comutatividade não é satisfeita pelo produto entre matrizes, mesmo que B A seja definida, isto é m=p e mesmo que B A seja do mesmo tipo que A B , o que só ocorrerá se m=p=n (isto é ambas as matrizes são quadradas e de mesma dimensão), assim de uma forma geral tem-se: A B B A . 2 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL Se a primeira parcela do produto é um vetor linha uT (1,n) e a segunda parcela é um vetor coluna v (n,1) então o produto u T v é um n escalar: u T v u j v j que é j 1 comutável, isto é u v v u . Este produto é chamado de produto escalar de dois vetores. Se A é uma matriz (m,n) e v um vetor (n,1) então o produto A v é um vetor u T T n (m,1) cujo termo geral é: ui aij v j para i = 1, ..., m. Este produto pode ser efetuado de j 1 duas formas distintas: a1T T a (a) por linhas (método ij) considerando a partição por linhas da matriz A, isto é: A 2 , T am T a1 v T a v então: A v 2 , isto é o elemento i de u é dado por ui aTi v para i = 1, ..., m, que é T am v o produto escalar do vetor composto pelos elementos da linha i da matriz A com o vetor u. (b) por colunas (método ji): considerando a partição por colunas de A, isto é: A a1 a 2 an , então: v1 n v u A v a1 a 2 an 2 v1 a1 v2 a 2 vn a n vi ai , isto é o vetor u é i 1 v n uma combinação linear dos vetores coluna de A sendo os coeficientes desta combinação os elementos do vetor v. 1 2 7 Exemplo Ilustrativo A 3 4 , v 8 5 6 7 7 (a)método ij: u1 1 2 1 7 2 8 23 ; u2 3 4 3 7 4 8 53 e 8 8 23 7 u3 5 6 5 7 6 8 83 , logo: u 53 8 83 3 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 1 2 23 (b) método ji: u 7 3 8 4 53 . 5 6 83 A designação dos métodos como ij e como ji deve-se à forma como os loops de programação são efetuados, assim no primeiro método tem-se o seguinte fluxograma: Especificação de m e n a e v ij j u = 0 i para i= 1,...., m e j=1,.....,n i=1 u = u +a v i i ij j j=j+1 loop interno loop externo j <_ n j:n j>n i = i +1 i:m PARE i>m i <_ m j=1 4 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL Note que neste caso o loop externo é em i (linha)e o loop interno é em j (coluna). O segundo método é descrito pelo fluxograma: Especificação de m e n a e v ij j u = 0 i para i= 1,...., m e j=1,.....,n j=1 u=u+v a i loop interno i j ij i=i+1 loop externo i <_ m i:m i>m j=j+1 j>n PARE j:n j <_ n i=1 Note que neste caso o loop externo é em j (coluna) e o loop interno é em i (linha). 5 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL Estes métodos podem também ser ilustrados acompanhando passo a passo o Exemplo Ilustrativo anterior segundo cada um dos algoritmos. i j u1 u2 u3 1 1 7 0 0 1 2 23 0 0 Método ij 2 2 3 3 1 2 1 2 23 23 23 23 21 53 53 53 0 0 35 83 j i u1 u2 u3 1 1 7 0 0 1 2 7 21 0 Método ji 1 2 2 2 3 1 2 3 7 23 23 23 21 21 53 53 35 35 35 83 A operação de transposição de uma matriz A (m,n) consiste em trocar as linhas pelas colunas de A, esta nova matriz é chamada de matriz transposta de A , representada por AT, e é uma matriz (n,m) cujo termo da linha j e coluna i é aTji aij para j = 1, ... , n e i = 1, ... , m. Se a matriz A é simétrica então: A = AT. As propriedades que serão descritas a seguir aplicam-se exclusivamente a matriz quadradas (n,n) e a vetores coluna (n,1) e a vetores linha (1,n). Define-se como matriz identidade a matriz I cujo elemento geral é: 1 apenas se i=j , onde ij é chamado de delta de Kronecker, deste modo a I ij ij 0 sempre que i j matriz identidade é uma matriz diagonal cujos termos da diagonal são todos unitários, 1 0 0 0 1 0 assim: I , entendendo-se como matriz diagonal uma matriz quadrada em 0 0 1 que apenas os elementos da diagonal (também chamada de diagonal principal) são não d1 0 0 0 d2 0 nulos, geralmente uma matriz diagonal D é representada na forma 0 0 dn mais compacta: D diag d1 d2 dn . Note que toda matriz diagonal é simétrica. Uma propriedade muito importante da matriz identidade é: I A A I A , isto é, a matriz identidade pré-multiplicada ou pós-multiplicada por qualquer matriz quadrada de mesma dimensão não altera o valor de elemento algum desta matriz. 6 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL Uma matriz diagonal é um caso particular de matrizes dita esparsas, que são matrizes que apresentam um grande número de elementos nulos, sendo os elementos não nulos mais a exceção do que a regra. Algumas destas matrizes são apresentadas abaixo: 1) matrizes tridiagonais são matrizes que apresentam apenas os elementos da diagonal, os elementos sobre a diagonal e os elementos sob a diagonal não nulos, sendo os demais nulos, assim se A é uma matriz tridiagonal então: 0 se i = j - diagonal 0 se i = j+1 (para i= 2,...,n)-sob a diagonal aij 0 se i = j - 1 (para i=1,...,n-1)- sobre a diagonal =0 em qualquer outro caso 2) matrizes bidiagonais são matrizes que apresentam apenas os elementos da diagonal e os elementos sobre a diagonal ou sob a diagonal não nulos, no primeiro caso diz-se que a matriz é bidiagonal superior e no segundo caso bidiagonal inferior. 3) matrizes triangulares são matrizes que apresentam todos os elementos sob (ou sobre) a diagonal nulos, sendo neste caso chamada de matriz triangular superior ou matriz U (ou triangular inferior ou matriz L), assim: U ij 0 se i > j e L ij 0 se j > i . Algumas vezes para evitar ambigüidades representa-se a matriz identidade de dimensão n por In. O traço de uma matriz quadrada A é a soma dos elementos de sua diagonal, isto é: n tr A aii . i 1 Uma matriz quadrada A é dita positiva definida se xT A x 0 para todo vetor x 0 (isto é não nulo), caso xT A x 0 a matriz A é dita positiva semi-definida e se xT A x 0 para alguns vetores x 0 e se xT A x 0 para algum vetor x 0 a matriz A é dita não-definida. Além disto, A é dita negativa definida se xT A x 0 para todo vetor x 0 e é dita negativa semi-definida caso xT A x 0 . O determinante de uma matriz A é um escalar obtido através da soma de todos os produtos possíveis envolvendo um elemento de cada linha e cada coluna da matriz, com o sinal positivo ou negativo conforme o número de permutações dos índices seja par ou ímpar. Sua obtenção e sua representação, apesar de ser um dos conceitos mais preliminares envolvendo matrizes, não são tarefas triviais e o conceito de determinante será utilizado nestas notas apenas como base de outras propriedades de matrizes quadradas. Assim, o determinante de A designado por det(A) pode ser representado por: det A a1,i1 a2,i2 an ,in , ou então através do conceito de cofator do elemento ij da matriz A (representado por Aij)que é o determinante da matriz obtida cancelando a linha i e a coluna j da matriz A com o sinal mais ou menos conforme i+j seja par ou ímpar, assim: Aij (1)i j det ij onde ij é matriz quadrada (n-1,n-1) obtida pela eliminação da linha i e a coluna j de A.. Tem-se então: 7 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL n det A aij Aij j 1 (expansão do determinante pela linha i), n det A aij Aij i 1 (expansão do determinante pela coluna j). n Além disto: a j 1 ij Akj 0 se k i (pois equivaleria a dizer que a matriz A apresenta duas n linhas iguais, no caso as linhas i e k); e a i 1 ij Aik 0 se k j (pois equivaleria a dizer que a matriz A apresenta duas colunas iguais, no caso as colunas j e k). Na prática, entretanto, é praticamente impossível calcular o determinante de matrizes através destas regras gerais por envolver um número muito grande de termos [na realidade n!, assim mesmo com matrizes relativamente pequenas como com n=10 tem-se 3 milhões de termos]. Felizmente, para os nossos propósitos, apenas as regras a seguir serão suficientes: O determinante de uma matriz A mantém-se inalterado se somarem-se a todos os elementos de qualquer linha (ou coluna) os correspondentes elementos de uma outra linha (ou coluna) multiplicados pela mesma constante ; se aij é o único elemento não nulo da linha i ou da coluna j então: det A aij Aij ; a b a b se A ad bc . então : det( A) c d c d Da regra verifica-se que se det(A) = 0 então A apresenta duas linhas (ou colunas) proporcionais entre si, ou ainda, de uma forma mais geral, pode-se afirmar que uma linha (ou coluna) de A pode ser escrita como combinação linear de alguma ou algumas linhas (ou colunas) da mesma matriz. Da regra demonstra-se que se A for uma matriz triangular então det(A) é simplesmente o produto dos elementos de sua diagonal (note que o mesmo vale para matrizes bidiagonais que são também matrizes triangulares). Se det(A) = 0 diz-se que a matriz A é singular, e caso det(A) 0 então A é dita regular. Se C A B então det(C) = det(A) . det (B). Se B = AT então det(B) = det(A), isto é det(AT) = det(A) A matriz adjunta de uma matriz A é a matriz transposta da matriz obtida substituindo cada elemento da matriz A pelo seu correspondente cofator, isto é se à é a matriz adjunta de A então o elemento da linha i e coluna j de à é Aji. A propriedade mais importante da matriz adjunta diz respeito aos produtos: P=A à e Q=à A o primeiro n n k 1 k 1 produto tem com termo geral: pij aik akj aik Ajk det( )ij 8 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL n n k 1 k 1 e o segundo produto: qij aik akj Aki akj det( )ij , assim: A A det( A)I . Deste modo se det(A) 0 (A é regular) define-se: AA 1 a chamada inversa de A que tem como propriedade: A 1 A det( A ) A A 1 A 1 A I que existe apenas se det(A) 0. Note que det A 1 1 det A Exemplo Ilustrativo: Considere a seguinte matriz (2x2): A11 d ; A12 c a b , permitindo determinar a A , assim, seus cofatores são: c d A21 b ; A 22 a d b , note que: matriz adjunta: A c a d b 1 A A (a d b c) 1 0 det( A) I A 1 AA , isto é, para ( a d b c ) c a 0 1 determinar a inversa de uma matriz (2x2) basta trocar os elementos da diagonal principal, trocar o sinal dos elementos da diagonal secundária e dividir a matriz resultante pelo determinante da matriz original. Se A 1 AT , isto é a inversa da matriz é igual a sua transposta, então a matriz A é chamada de matriz ortogonal., e neste caso o det(A) = +1 ou -1 . Exemplo Ilustrativo - Considere a mudança de coordenadas em 2 resultante da simples rotação dos eixos, conforme mostrado abaixo: x2 y y 2 1 u 1 v P 2 r O v1 x1 u2 vê-se da figura acima que no sistema original (x1 , x2 ) : v1 = r cos() e : v2 = r sen(), o vetor OP faz um ângulo igual a - com o eixo y1 e projeta-se na porção negativa do eixo u1 r cos r cos cos r sen sen y2, assim: ou seja: u2 r sen r sen cos r cos sen 9 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL u1 cos v1 sen v2 ou, u2 sen v1 cos v2 u1 cos sen v1 , u2 sen cos v2 cos sen cos sen T identificando a matriz da transformação : T T , sen cos sen cos tem-se: cos 2 sen 2 cos sen sen cos 1 0 e T TT sen 2 cos 2 sen cos cos sen 0 1 em termos matriciais: cos 2 sen 2 cos sen sen cos 1 0 TT T . 2 2 0 1 cos cos cos sen sen sen Verificando-se assim que a matriz T é uma matriz ortogonal. É interessante verificar que os vetores coluna da matriz T são exatamente os 1 0 componentes dos vetores e1 e e 2 no novo sistema de coordenadas, em acordo 0 1 com a figura abaixo: x2 x2 y y y 2 1 e cos( ) r cos( ) O y1 2 e 1 2 sen( ) x 1 O x1 -sen() 3) ALGUMAS PROPRIEDADES FUNDAMENTAIS DE OPERAÇÕES ENTRE MATRIZES As leis de associação e de comutação são válidas para as operações de adição/subtração, assim: (A+B)+C = A+(B+C) e A+B = B+A. São válidas também as leis de associação e de distribuição para a multiplicação, assim: (AB)C = A(BC) ; A(B+C) = AB + AC e (A+B)C = AC + BC Para a matriz transposta tem-se as seguintes propriedades:(A+B)T = AT + BT e (AB) = BT AT e para a matriz inversa: (AB)-1 = B-1 A-1 e (A-1)T= (AT)-1 Um menor de ordem p de uma matriz A (n,n) é o valor do determinante da matriz obtida eliminando-se n-p linhas e n-p colunas da matriz A. Se uma matriz A apresenta a propriedade de todos os menores de ordem (r + 1 ) serem nulos e de pelo menos um menor de ordem r ser não nulo então diz-se T 10 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL que a matriz A é de posto (rank) r . Note que todo matriz quadrade (n,n) regular ( ou não singular) apresenta o posto igual a n. Um conjunto de n vetores u1, u2, ..., un com n elementos é dito linearmente independente se os únicos valores de c1 , c2 , ....cn tais que: c1 u1+c2 u2+ ....+cn un= 0 são:c1 =c2 = ...=cn = 0. Neste caso os vetores u1, u2, ..., un formam uma base de n e todo vetor deste espaço de dimensão n (que é o numero máximo de vetores linearmente independentes que pode existir neste espaço, que também é igual ao número de elementos destes vetores) pode ser expresso como uma combinação linear dos vetores da base, os coeficientes desta combinação linear são os componentes do vetor nesta base. Os componentes de um vetor qualquer do n apenas confundem-se com seus elementos quando adota-se a base canônica do n, que é a base composta pelos vetores unitários ei cujo único elemento não nulo é o i’ésimo, isto é : eij = ij, desta forma os vetores coluna ou os vetores linha da matriz identidade I são os vetores da base canônica do n. Em uma matriz de posto r todos seus vetores linha (ou coluna) podem ser escritos como uma combinação linear de r vetores linha (ou coluna), desta forma o posto de uma matriz é também o número máximo de vetores linha (ou coluna) linearmente independentes. Uma forma de determinar o posto de uma matriz é através do processo de ortogonalização de Gram-Schmidt aplicado aos vetores linha ou aos vetores coluna da matriz, este processo pode ser resumido na forma, sejam: v1 , v2 , ... , vn os vetores coluna (ou linha) de A, então adota-se: u1 = v1 vT u u 2 v 2 2 2 1 u1 u 1 vT u vT u u 3 v 3 3 2 1 u 1 3 2 2 u 2 u2 u1 ...................................................................... j1 T v j uk u k para j = 2, ..., n com u1 = v1 u j v j 2 k 1 u k onde p p 12 p 22 p 2n (módulo de p) Encontrando-se durante este processo algum vetor uk com módulo nulo ( ou menor que um valor pequeno preestabelecido) abandona-se este vetor e prossegue-se o procedimento renumerando-se os vetores subseqüentes, ao final do processo o número de vetores uk não nulos é igual ao posto da matriz. Este procedimento pode ser também aplicado a matrizes não-quadradas. Exemplos Ilustrativos :Calcular através do processo de ortogonalização de Garm-Schmidt o posto de cada uma das matrizes abaixo: 11 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 2 3 7 (a) 4 6 2 ; (b) 4 0 1 3 1 2 2 4 1 1 2 4 ; (c) 5 10 6 3 1 1 2 2 4 1 3 1 2 4 4 . 5 10 6 10 2 3 7 (a) utilizando os vetores coluna da matriz, isto é: v 1 4 ; v 2 6 e v 3 2 , 4 0 1 2 tem-se: u 1 v 1 4 u 1 6 ; u 1T v 2 u 1T v 3 18 4 vT u 3 18 2 4 u 2 v 2 2 2 1 u 1 6 2 4 4 u 2 6 ; u T2 v 3 18 u 0 6 4 2 1 vT u vT u 7 18 2 18 4 4 u 3 v 3 3 2 1 u 1 3 2 2 u 2 2 2 4 2 4 2 u 3 6 u u 1 6 4 6 2 4 1 2 como os 3 vetores u1 , u2 e u3 são não nulos o posto da matriz é igual a 3. 2 4 4 utilizando os vetores linha da matriz, isto é: v 1 3 ; v 2 6 e v 3 0 , 7 2 1 2 tem-se: u 1 v 1 3 u 1 62 ; u 1T v 2 4; u 1T v 3 1 7 vT u 4 4 2 3,871 u 2 v 2 2 2 1 u 1 6 3 6,194 u 2 7 ,466 ; u 2T v 3 13,935 u 62 7 1,548 2 1 vT u vT u 4 1 2 13,935 3,871 3 u 3 v 3 3 2 1 u 1 3 2 2 u 2 0 6,194 2 u u 62 7 7 ,466 1,548 1 1 2 3 1,5 u 3 13,5 , novamente tem-se os 3 vetores u1 , u2 e u3 não nulos e o posto da 1,5 matriz é igual a 3. 1 2 3 2 4 1 (b) utilizando os vetores coluna da matriz, isto é: v 1 1 ; v 2 2 e v 3 4 , 5 10 6 1 2 u 1 v 1 1 u 1 31 ; u 1T v 2 62; u 1T v 3 33 5 12 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 2 1 0 vT u 62 2 0 4 2 1 u1 u2 v 2 u2 0 2 u 2 31 1 0 1 10 5 0 3 1 4 ,065 vT u 33 2 1,129 1 novo: u 2 v 3 3 2 1 u 1 4 1 u 2 5,184 , como u 31 2 ,935 1 6 5 0,677 apenas 2 vetores coluna linearmente independente o posto desta matriz é igual a 2; utilizando os vetores linha da matriz, isto é : 1 2 1 5 v 1 2 ; v 2 4 ; v 3 2 e v 4 10 , tem-se: 3 1 4 6 há 1 u 1 v 1 2 u 1 14 ; u 1T v 2 u 1T v 4 7 e u 1T v 3 7 3 vT u 2 7 1 1,5 u 2 v 2 2 2 1 u 1 4 2 3 u 2 17,5 ; u 2T v 3 17,5 e u 1 14 3 2,5 1 u T2 v 4 52,5 vT u vT u 1 7 1 17 ,5 1,5 0 3 0 u 3 0 n u 3 v 3 3 2 1 u 1 3 2 2 u 2 2 2 2 ,5 0 u u , 14 17 5 4 3 1 2 ovo: u3: vT u vT u 5 7 1 52 ,5 1,5 0 3 0 u 3 0 u 3 v 4 4 2 1 u 1 4 2 2 u 2 10 2 u u 14 17 5 , 6 3 2 ,5 0 1 2 desta forma a matriz apresenta apenas 2 vetores linha linearmente independentes reconfirmando que a matriz tem posto = 2; (c) utilizando os vetores coluna da matriz, isto é: 1 2 3 1 2 4 1 3 v 1 1 ; v 2 2 ; v 3 4 e v 4 4 , 5 10 6 10 1 2 u 1 v 1 1 u 1 31 ; u 1T v 2 62; u 1T v 3 33 e u 1T v 4 59 5 2 1 0 vT u 62 2 0 4 2 1 u1 u2 v 2 2 2 31 1 0 u 2 0 u 1 10 5 0 13 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 3 1 4 ,065 vT u 33 2 1,129 1 3 1 u1 novo: u 2 v 3 u 2 5,184 , 2 u 4 31 1 2 ,935 1 6 5 0,677 u T2 v 4 19 ,194 4,065 0 1 1 vT u vT u 1129 , 59 19 194 , 0 3 2 0 u 3 v 4 4 2 1 u 1 4 2 2 u 2 4 1 2 2, 935 u u 31 5,184 2 1 10 5 0,677 0 u 3 0 ;como há apenas 2 vetores coluna linearmente independente o posto desta matriz é igual a 2, isto pode ser reconfirmado com os vetores linha da matriz. 4) FUNÇÕES DE MATRIZES De forma análoga a funções analíticas de variáveis escalares que podem, em um certo domínio, ser expandidas em séries de potências da forma: 1 d i f (x) f ( x ) c i x i onde : c i tem-se as funções de matrizes que é um matriz i ! dx i x 0 i 0 da forma: f ( A ) c i A i . Como exemplo tem-se a função exponencial de uma matriz A i 0 definida , em analogia à função ex = 1 i! x i , pela série: i 0 1 A i , note que esta função apresenta as propriedades: i 0 i ! i-) exp(0) = I onde 0 é a matriz nula; ti ii-) exp At e At A i onde t é um escalar, assim: i 0 i ! i 1 d exp At it ti i A A A i A exp( At ) ou seja se t exp At , tem-se: dt i 0 i ! i 0 i ! d t 0 I e A t , ou seja a matriz t é solução da equação diferencial dt d t A t , sujeita à condição inicial 0 I . ordinária matricial dt exp A e A Uma forma mais simples para determinar funções de matrizes pode ser desenvolvida através da aplicação do Teorema de Cayley-Hamilton que estabelece que todo a matriz quadrada A é raiz de seu polinômio característico, isto é se p n c 1 n 1 c 2 n 2 c n 1 c n é o polinômio característico de A, então: 14 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL p A A n c 1 A n 1 c 2 A n 2 c n 1 A c n I 0 . A demonstração deste teorema pode ser feita definindo-se a matriz adjunta da matriz I- A, isto é: C = adj(I- A) que pode ser expressa na forma: C C1 n 1 C 2 n 2 C n 1 C n , onde Ck k= 1, 2, ...,n são matrizes do mesmo tipo de A, mas : (I- A)[adj(I- A)]=det(I- A)I = p()I, ou seja: I A C1 n 1 C2 n 2 Cn 1 Cn n c 1 n 1 c 2 n 2 c n 1 c n I igualando os termos eqüipotentes de , tem-se: C1 I A n A n C1 A n C A C c I A n 1 A n 1 C A n C c A n 1 1 1 2 1 1 2 C 3 A C 2 c 2 I A n 2 A n 2 C 3 A n 1 C 2 c 2 A n 2 somando todos os termos 2 C n A C n 1 c n 1 I A A C n A C n 1 c n 1 A 0 A C n c n I A I A C n c n I após tem-se: A n c 1 A n 1 c 2 A n 2 c n 1 A c n I p A 0 . Uma conseqüência do teorema de Cayley-Hamilton é que: A n c 1 A n 1 c 2 A n 2 c n 1 A c n I , multiplicando membro a membro por A: A n 1 c 1 A n c 2 A n 1 c n 1 A 2 c n A substituindo a expressão de An, tem-se: A n 1 c 12 c 2 A n 1 c 1 c 2 c 3 A n 2 c 1 c n 1 c n A c 1 c n I , e assim sucessivamente, o que permite concluir que : A m d 1 A n 1 d 2 A n 2 d n 1 A d n I para m = 0, 1, 2,..... Além disto se A é regular, multiplica-se membro a membro de p(A) por A-1, resultando em : A n 1 c 1 A n 2 c 2 A n 3 c n 1 I c n A 1 0 ou seja: 1 A 1 A n 1 c 1 A n 2 c 2 A n 3 c n 1 I { note que cn =(-1)ndet(A) 0 pois cn A é regular ou não-singular), assim sendo se A é regular: A m d 1 A n 1 d 2 A n 2 d n 1 A d n I para m = 0, 1, 2,...... A aplicação do Teorema de Cayley-Hamilton à série de potências f ( A ) c i A i i 0 n 1 permite reescrevê-la na forma: f ( A ) i A i pois potências superiores à (n-1) da i0 matriz A pode, pelo teorema de Cayley-Hamilton, serem expressas em termos das (n-1) primeiras potências da matriz A, além disto de acordo com a propriedade anteriormente apresentada de que se é um valor característico e v o correspondente vetor característico de A, então q() é valor característico e v o correspondente vetor característico de q ( A ) A m a 1 A m 1 a 2 A m 2 a m1 A a m I tem-se que os valores característicos de n 1 f(A) satisfazem a: f ( ) i i , então para determinar os coeficientes i , assim i0 procede-se: 15 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL (i) se os valores característicos de A são todos distintos, resolve-se o sistema linear de n 1 equações: i ik f ( k ) para k = 1, 2, ...n; i0 Se A é uma matriz (2,2), 0 , 1 é solução de : f ( 1 ) 1 f ( 2 ) 0 2 0 1 1 f ( 1 ) 2 1 0 1 2 f ( 2 ) 1 f ( 2 ) f ( 1 ) 2 1 2 f ( 1 ) 1 f ( 2 ) 0 lim f ( 1 ) 1 f ( 1 ) 2 1 2 1 caso 1 = 2 tem-se: ( ) ( ) f f 2 1 lim f ( 1 ) 1 2 1 2 1 o mesmo resultado poderia ser obtido derivando-se a segunda equação do sistema em relação a 2 e, em seguida, fazer 21, assim: 0 1 1 f ( 1 ) 0 f ( 1 ) 1 f ( 1 ) 1 f ( 1 ) 1 f ( 1 ) 4 2 -3 Exemplos Ilustrativos: (a) para A calcule A e ln(A); 1 3 5 3 (b) para A calcule 2 2 A. (a) p( ) 2 7 10 2 5 1 2 e 2 5 , assim: 5 8 2 125 5f ( 2 ) 2 f (5) 0 0,203 0 -3 3 3 ; para f(x)=x tem-se: logo: f (5) f ( 2 ) 1 125 1 8 1 1 0,039 3 3 4 2 0,047 0078 1 0 A 3 0,203 e 0,039 1 3 0,039 0,086 0 1 5 ln( 2 ) 2 ln(5) 0,082287 0 3 para f(x)=ln(x), tem-se então: ln(5) ln( 2 ) 1 0,30543 3 4 2 1,304008 0,610860 1 0 B ln( A ) 0,082287 , esta última 0,305430 1 3 0,30543 0,998577 0 1 função matricial está correta se a função inversa também é verdadeira, isto é : A = exp(B), para isto deve-se inicialmente determinar os valores característicos de B que são 16 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 2 2 51 0 0,269412 2 1 1=0,693147 e 2=1,609438 determina-se a seguir: e então: 5 2 1 3,27407 2 1 1,304008 0,610860 4 2 1 0 exp( B ) 0,269412 A 3,27407 0,30543 0,998577 1 3 0 1 (b) p( ) 2 3 4 1 4 1 1 e 2 4 então como f ( x ) x , tem4i 2 0 5 0,4 0,8i e se: f 1 1 i e f 2 4 2 logo: 2 i 1 0,4 0,2 i 5 5 3 2 ,4 0,2 i 1,2 0,6i 1 0 A 0,4 0,8i note que: 0,4 0,2 i 2 2 0,8 0,4 i 0,4 1,2 i 0 1 A 2 2 ,4 0,2 i 1,2 0,6i 0,8 0,4 i 0,4 1,2 i 2 ,4 0,2 i 1,2 0,6i 5 3 A 0,8 0,4 i 0,4 1,2 i 2 2 (ii) se a matriz A apresenta valores característicos múltiplos, por exemplo, 1 2 m m1 n , neste caso para levantar a indeterminação no cálculo dos coeficientes i , deriva-se em relação a 1 m vezes a equação correspondente a 1 , n1 assim: i i1 f ( 1 ) ; i m n 1 i i i1 1 f ( 1 ) ; i1 i 0 n1 i (i 1) (i m 1) n1 i i i1 m n1 i (i 1) i i1 2 f ( 1 ) ; ....; i 2 d f ( ) dm m sendo as demais equações: 1 ik f ( k ) para k = m+1, m+2, ...n. i0 1,750 2 ,000 0,250 Exemplo Ilustrativo: para A 0,125 2 ,000 0,375 calcule exp(A); 0,250 2 ,000 0,250 2 ,000 0,250 1,750 0,125 2 ,000 0,375 3 42 5 2 0 1 2 1 p( ) det 2 ,000 0,250 0,250 e 3 2 , assim: 0 1 2 exp( 1) 0 0,871094 1 2 2 exp( 1) tem-se assim: 1 0,638550 logo: 2 4 exp( 2) 0,135335 1 2 0 2 17 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 2 1 0 0 1,750 2 ,000 0,250 1,750 2 ,000 0,250 exp A 0,871094 0 1 0 0,638550 0,125 2 ,000 0,375 0,135335 0,125 2 ,000 0,375 0 0 1 0,250 2 ,000 0,250 0,250 2 ,000 0,250 = 0,193471 1,065512 0,358348 0,029068 0,435547 0,062902 0,058136 0,135335 0,242076 Caso desejar-se determinar uma série de potências f ( At ) c i t i A i t i 0 onde a variável t é uma variável escalar real, esta função pode ser rescrita na forma: ( t ) n 1 t A i i onde i t é uma função escalar de t determinada através da i 0 solução de: n 1 (i) t i k i f ( k t ) para k = 1, 2, ...n se os valores característicos de A são todos i 0 distintos; n 1 (ii) t i 1 i f ( 1 t ) ; i 0 n 1 i t i 1 1 i i 1 df ( ) t ; d 1 t 2 i2 2 d f ( ) i ( i 1 ) t t ; i 1 2 i2 d 1 t m n 1 i m m d f ( ) i ( i 1 ) ( i m 1 ) t t i 1 m i m d 1 t sendo as demais equações: n 1 n 1 t i i k f ( k t ) para k = m+1, m+2, ...n. se i 0 1 2 m m1 n 4 2 Exemplos Ilustrativos: (a) para A calcule exp(At); 1 3 3 2 2 1 (b) para A calcule. exp(At). (a) p( ) 2 7 10 2 5 1 2 e 2 5 , assim: 18 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 5e2 t 2 e5t 0 3 5t e e2 t 1 3 5e 2 t 2 e 5t 1 0 e 5t e 2 t 4 2 ; logo: exp( At ) então: 3 1 3 3 0 1 e 2 t e 5t 1 0 5e 5t 2 e 2 t 4 2 d[exp( At )] 10 e 3 3 0 1 dt 1 3 5e 2 t 2 e 5t 4 2 e 5t e 2 t 4 2 1 0 A[exp( At )] 7 10 3 3 1 3 0 1 1 3 e 2 t e 5t 1 0 5e 5t 2 e 2 t 4 2 d[exp( At )] e 10 3 3 0 1 dt 1 3 exp(A0)=I, comprovando que esta matriz exponencial está correta. 2 (b) p( ) 2 2 1 1 1 2 1 deve-se assim resolver o sistema: d 0 t t 0 1 t e t 0 1 1 e 1t dt te 0 1 e assim: t t d 1 t 1 te 1t te te 1 1 1 t e dt 3 2 1 0 1 0 t exp( At ) 1 t e t ; exp( At ) t 0 te e 3 2 0 1 0 1 d exp( At ) dt 3 2 1 0 t te t e (1 t ) e 3 2 0 1 3 2 1 0 d[exp( At )] 3 2 t A[exp( At )] 1 t e t te 2 3 0 1 3 dt 2 2 comprovando que a matriz exponencial está correta. 5) FORMAS QUADRÁTICAS Em 2 a expressão geral das formas quadráticas é: a a f ( x 1 , x 2 ) c b 1 x 1 b 2 x 2 11 x 12 a 12 x 1 x 2 22 x 22 , 2 2 cujas derivadas parciais são: f ( x 1 , x 2 ) f ( x 1 , x 2 ) b 1 a 11 x 1 a 12 x 2 e b 2 a 22 x 2 a 12 x 1 x 2 x 1 2 f ( x1 , x 2 ) a 11 ; f ( x 1 , x 2 ) f ( x 1 , x 2 ) 2 f ( x1 , x 2 ) a 12 e a 22 . x 2 x 1 x 1x 2 x 22 x 12 Esta forma quadrada pode ser rescrita em forma matricial, segundo: 19 , PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL f (x1 , x 2 ) c b1 1 x b 2 1 x 1 x2 2 a x 2 11 a 12 x b a x 1 2 , b 1 2 e A = 11 a 12 b2 x2 1 f x c b T x x T A x 2 a 12 x 1 , ou seja, definindo: a 22 x 2 a 12 2 x 2 [ matriz simétrica], tem-se: a 22 x 1 definindo o operador diferencial vetorial : = (operador gradiente) , tem-se: x 2 f ( x 1 , x 2 ) x 1 b A x (vetor gradiente de uma função escalar f) e f(x) = f ( x 1 , x 2 ) x 2 2f(x) = x 1 f ( x 1 , x 2 ) 2 f (x , x ) 2 f (x , x ) x 1 1 2 1 2 a 11 a 22 tr A f ( x , x ) 2 2 x 2 1 2 x1 x2 x 2 (Laplaciano de uma função escalar). Define-se também a matriz Hessiana por: f ( x , x ) x 1 2 H x 1 x 1 x 2 2 f (x1 , x 2 ) f ( x 1 , x 2 ) 2 x1 2 x 2 f (x1 , x 2 ) x x 2 1 2 f (x1 , x 2 ) x 1x 2 A. 2 f ( x 1 , x 2 ) 2x2 Estas definições podem ser generalizadas para n, segundo: x1 b1 a 11 a 12 a 1n x2 b2 a 12 a 22 a 2 n n n x , b e A = nxn [ matriz simétrica], xn bn a 1n a 2 n a nn tem-se: f x c b T x n 1 T 1 n n x A x c b i x i a ij x i x j , 2 2 i 1 j 1 i1 20 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL f (x) x 1 f (x) f(x) = x 2 b A x , f (x) x n 2f(x) = x 1 f (x) x 1 f (x) x 2 a 11 a 22 a nn tr A x n f (x) x n x 2 x 1 f (x) H x x 2 x 1 x n 2 f ( x) 2 x1 2 f (x) f (x) f (x) x 2 x n x 2 x 1 2 f ( x) x x n 1 2 f (x) x 1 x 2 2 f (x) 2x2 2 f (x) x n x 2 2 f ( x) x 1 x n 2 f ( x) x 2 x n A 2 f ( x) 2 xn 2 f ( x) 2 f ( x) H ij (x) H ji (x) [matriz simétrica]. Note que caso a matriz A não seja x i x j x j x i simétrica redefinem-se seus elementos na forma: a ij,velha a ji,velha 1 a ij,velha ou, em termos matriciais, A nova A velha A Tvelha 2 2 A forma quadrática acima pode ser simplificada, através de um translação do eixo, tal que o termo bTx desapareçam, assim sejam as novas coordenadas (y1 , y2, ..., yn) tais que: x=y+d assim: b T x b T y b T d e x T A x y T d T A y A d y T A y y T A d d T A y d T A d y T A y 2d T A y d T A d pois : y T A d d T A y [ A é simétrica], logo: 1 1 f y c b T y b T d y T A y d T A y d T A d 2 2 1 identificando : f d c b T d d T A d c e definindo b b A d 2 21 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 1 f y c b T y y T A y , adotando d tal que : b b A d 0 d A 1 b o que 2 só será possível se A for regular, assim chega-se a: 1 1 f y c y T A y onde : x=y+d , d A 1 b e c f d c b T d d T A d , 2 2 neste novo sistema de coordenadas tem-se: f ( y) y1 f ( y) f(y) = y A y , neste novo sistema de coordenadas o valor da variável 2 f ( y) y n independente y que anula o vetor gradiente é o valor nulo, isto é a origem : y=0 e neste ponto o valor da função f(y) é igual a : c . Esta condição, f(y) =0 é uma condição necessária para o ponto ser um extremo da função (máximo ou mínimo) e é chamado de ponto crítico, este ponto será um ponto de mínimo se para qualquer vizinhança de y =0 , isto é : y , a função é f(y) > f(0) = c , ou seja : y T A y 0 e, neste caso, a matriz A é chamada de positiva definida e caso em toda vizinhança de y=0 a é f(y) < f(0) = c , ou seja : y T A y 0 e, neste caso, a matriz A é chamada de negativa definida e o ponto é um ponto de máximo. Em qualquer outra situação o ponto não é nem de máximo nem de mínimo, e no caso da matriz ser não definida tem-se o chamado ponto de sela. A forma quadrática pode também ser rescrita em sua forma canônica, de forma análoga à apresentada no processo de diagonalização de matrizes, assim considerando y P z , onde P é a matriz cujos vetores coluna são os vetores característicos normalizados de A (por enquanto considerados n vetores característicos linearmente independentes e ortogonais entre si, isto é os valores característicos são todos reais e distintos - matriz A é simétrica ), tem-se assim: 1 1 1 n f z c z T P T A P z c z T D z c i z 2i , como à origem y=0 2 2 2 i1 n correspondente também a z=0, tem-se z=0 como ponto de mínimo se i z 2i 0 para i1 todo o domínio em que z 0 se i 0 para todo i = 1, , n , z=0 é um ponto de n máximo se i z 2i 0 para todo i1 o domínio em que z 0 se i 0 para todo i = 1, , n e z=0 é um ponto de sela se não há vizinhança de z=0 na 22 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL n qual i z 2i i1 não muda de sinal o que ocorre se alguns i 0 e os demais são i 0 . No 2 a forma canônica assume a forma: 1 f ( z 1 , z 2 ) c 1 z 12 2 z 22 , neste caso a forma das curvas de nível caracterizam as 2 2 1 2 , asssim seguinte cônicas, de acordo com o sinal de = det (A) = a 11 a 22 a 12 com > 0 : elipse; < 0 : hipérbole e = 0 : parábola . (a) Elipse: neste caso os valores característicos têm o mesmo sinal, sendo z=0 um ponto de mínimo se ambos forem positivos e um ponto de máximo se ambos forem positivos. O 2 2 tamanho do eixo z1 é K c e do eixo z2 é K c , onde K=f(z1,z2) [ verificando 1 2 que se z=0 é um ponto de mínimo K c , 1 0 e 2 0 e se z=0 é um ponto de máximo 2 2 K c , 1 0 e 2 0 , deste modo em ambos os casos: K c 0 e K c 0 ]. 1 2 A seguir representam-se s superfície f(z1,z2) e as correspondentes curvas de contorno: 1 1 1.5 1.5 1 0.5 0.5 1 0.5 0.5 1 0 0.5 1 1 0.5 0.5 0.5 1.5 1 1 1.5 1 1 M 0.5 0 0.5 1 M f ( z 1 , z 2 ) z12 5 z 2 2 (b) Hipérbole: neste caso os valores característicos têm os sinais distintos, sendo z=0 um ponto de sela Abaixo representam-se a superfície f(z1,z2) e as correspondentes curvas de contorno 23 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL 1 0.5 0 0.5 0 0.5 0.5 0 0.5 0.5 0 0 0 0 0.5 0.5 0.5 0.5 0 0 0.5 0.5 1 1 M 0.5 0 0.5 1 M f ( z 1 , z 2 ) z12 5 z 2 2 (c) Parábola: neste caso um dos valores característicos é nulo e portanto a matriz A é singular, desta forma não é possível fazer a translação de eixo que elimina o termo bTx. Então neste caso a rotação dos eixos é aplicada diretamente às variáveis (x1 , x2), isto é : x P z , obtendo-se : ~ ~ f ( z 1 , z 2 ) c b1 z 1 b 2 z 2 1 z 12 se 2 = 0 ou: 2 35 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL ~ ~ ~ ~ f ( z 1 , z 2 ) c b 1 z 1 b 2 z 2 2 z 22 se 1 = 0, onde b P b b P b . Verifica-se 2 assim que a condição necessária não é obtida em nenhum dos casos, pois no primeiro caso f ( z 1 , z 2 ) ~ b1 1 z 1 z 1 tem-se: f(z) = segundo componente não nulo, ~ b2 f ( z 1 , z 2 ) z 2 f ( z 1 , z 2 ) ~ z 1 b1 e no segundo caso tem-se: f(z) = ~ primeiro componente não f ( z 1 , z 2 ) b 2 2 z 2 z 2 nulo. Deste modo em ambos os casos um dos componentes do vetor gradiente é constante não podendo ser anulado através da escolha de z1 ou z2, neste caso não se tem nem máximo nem mínimo. Abaixo, representa-se curvas de nível para cada um dos casos. 1 1 0.5 25 15 15 20 10 10 15 0 20 25 30 0.5 5 5 20 25 0 0 5 5 0.5 5 0 10 5 10 15 15 0 10 0 5 5 0 15 5 5 10 10 10 5 10 15 0.5 10 0 1 5 0 5 10 15 20 25 1 1 0.5 0 0.5 1 M 1 0.5 0 0.5 1 M curvas de nível (um dos val. caract. =0) f z 1, z 2 z1 curvas de nível (um dos val. caract. =0) 2. z 2 5. z 2 2 f z 1, z 2 41 z2 2. z 1 5. z 1 2 PARTE DO CURSO DE NIVELAMENTO 2009 - PEQ/COPPE/UFRJ PROF. EVARISTO ÁLGEBRA VETORIAL E MATRICIAL Lista de Exercícios 1) Mostre que todo matriz ortogonal apresenta o determinante +1 ou -1. Sugestão: parta dos princípios que det(A)=det(AT) e que det(A-1)=1/det(A). 2) Mostre que (A.B)T=BT.AT 3) Mostre que (A.B)-1=B-1.A-1 4) Mostre que (A-1)T=( AT)-1 42