Álgebra matricial Álgebra de matrizes é amplamente utilizada na estatística.. Matrizes Matriz: um conjunto de elementos arranjados em linhas e colunas. Exemplo: Linha 1 16 23 Linha 2 33 47 Linha 3 21 35 (Dimensão: 3 x 2) a11 A = a 21 (3 x 2) a 31 a12 a22 a32 i=1,2,3 (linhas) j=1,2 (colunas) Representada por letras em negrito, p.e., A, B, C, , , , , etc. 1 Matriz quadrada: 4 7 3 9 Vetor: a11 a 21 a31 a13 a23 a33 a12 a22 a32 Número de linhas = número de colunas. Contém apenas uma coluna. Também são representados por letras minúsculas em negrito. 4 Vetor linha ou transposto: B' 15 25 50 A 7 10 Matriz transposta (A’): A( 3 x 2 ) 2 5 7 10 3 4 ' A ( 2 x 3) 2 7 3 5 10 4 Igualdade de matrizes: mesma dimensão e todos os correspondentes elementos são iguais. A=B implica: a1 4 a1 A a2 (3 x 2) a3 a2 7 4 B 7 ( 3 x1) 3 a3 3 2 Adição e subtração de matrizes: 1 4 A 2 5 (3 x 2) 3 6 11 A B 2 2 (3 x 2 ) 3 3 11 A B 2 2 (3 x 2 ) 3 3 1 2 B 2 3 (3 x 2) 3 4 4 2 2 5 3 4 6 4 6 4 2 0 5 3 0 6 4 0 Matrizes de mesma dimensão 6 8 10 2 2 2 3 Multiplicação de matrizes: Por escalar: 2 7 8 28 4A 4 9 3 36 12 4 Multiplicação de matriz por matriz: 2 5 4 6 (2.4 5.5) (2.6 5.8) 33 52 AB 4 1 5 8 ( 4 . 4 1 . 5 ) ( 4 . 6 1 . 8 ) 21 32 2 2 2 2 2 2 Nota: geralmente ABBA. Exercício: faça a multiplicação das matrizes: 1 AB 0 3 5 3 4 5 . 8 2 5 Tipos especiais de matrizes Matriz simétrica: se A=A’ ela é dita simétrica. Exemplo: 1 4 6 4 2 5 A 3 3 6 5 3 1 4 6 A ' 4 2 5 6 5 3 6 Matriz diagonal: é uma matriz quadrada, cujos elementos fora da diagonal são todos iguais a zero, por exemplo, a1 A 0 0 0 a2 0 0 0 a3 Dois tipos importantes de matrizes diagonal são: matriz identidade e matriz escalar. Matriz identidade (I): é uma matriz diagonal cujos elementos da diagonal são todos iguais a um (1). Pré multiplicando (ou pós multiplicando) qualquer matriz A (r x r), pela identidade, a matriz A fica inalterada. 1 0 0 a11 IA 0 1 0 a21 0 0 1 a31 a12 a22 a32 a13 a11 a23 a21 a33 a31 a12 a22 a32 a13 a23 a33 Para uma matriz A de dimensão (r x r), temos: AI IA A 7 Matriz escalar: é uma matriz diagonal cujos elementos da diagonal são todos iguais. Pode ser dada por I: 0 0 1 0 0 0 0 0 1 0 I 0 0 0 0 1 Vetores e matrizes com todos os elementos iguais a um (1) 1 1 . r 11 . . 1 1 1 r J r . . 1 1 . . 1 1 . . 1 . . . . . . . . 1 . . 1 8 1 . 1'1 1 . . 1 n n . 1 Operações importantes: 1 1 . 1 11' 1 . . 1 . . 1 1 . . . . . . . . 1 1 n jn . 1 9 Dependência linear e posto de uma matriz Dependência linear Considere a matriz: 1 2 5 1 A 2 2 10 6 3 4 15 1 Observe que a terceira coluna é um múltiplo da primeira coluna: 5 1 10 52 15 3 10 Portanto, as colunas da matriz A, são linearmente dependentes. Elas contém informações redundantes (supérfluas), pois uma coluna pode ser obtida como uma combinação linear das outras. Considere c vetores colunas de uma matriz (r x c) : C1, C2,...,Cc.De modo geral, define-se dependência linear como: • quando c escalares 1,..., c, nem todos iguais a zero, podem ser determinados tal que: 1C1 2C2 ... cCc 0 Os c vetores colunas são linearmente dependentes 11 Se o único conjunto de escalares, para o qual a igualdade vale (=0) é: 1 0, 2 0,...,c 0 Os c vetores colunas são linearmente independentes Exemplo: considere os escalares:1=5, 2=0, 3=-1e 4=0, assim temos: 1 2 5 1 0 52 0 2 110 0 6 0 3 4 15 1 0 Portanto, as colunas são linearmente dependentes. Observe que alguns ’s são iguais a zero. Posto (rank) de uma matriz O posto de uma matriz é definida como sendo o número máximo de colunas (linhas) linearmente independentes. No exemplo acima, encontramos 3 colunas (1,2 e 4) linearmente independentes. Não existem escalares 1, 2 e 4 tal que 1C1+ 2C2+ 4C4=0 a não ser estes: 1=0, 2=0 e 4=0. Assim, o posto de A é 3. 12 Segue-se que o posto de uma matriz (r x c) não pode exceder o min(r,c), isto é, o mínimo entre r e c. No caso de uma matriz, por exemplo, C, que é o resultado do produto de duas outras matrizes (A e B), o rank de C não pode exceder o mínimo entre o rank(A) e o rank(B). (Definição: o rank, posto ou característica de uma matriz, é o número de linhas não nulas na sua forma escalonada canônica). Exercício: seja a matriz 4 2 2 A 2 2 0 2 0 2 encontre o valor do rank de (A). OBS. Matriz de rank incompleto 13 Inversa de uma matriz Na álgebra de matrizes, a inversa de uma matriz A (quadrada), é uma outra matriz, denominada por A-1, tal que: 1 A A AA 1 I Muitas matrizes quadradas não tem inversa. Para aquelas que têm, a inversa é única. 14 Encontrando a inversa. A inversa de uma matriz quadrada (r x r) existe se o rank da matriz é r. Esta matriz é denominada de não singular ou de posto completo.Uma matriz (r x r) com rank menor do que r é denominada de matriz singular ou de posto incompleto e não tem inversa. A inversa de uma matriz (r x r) de rank completo também tem rank r. Usaremos programas estatísticos ou matemáticos para encontrar inversas de matrizes. Por exemplo, para a matriz: 2 4 A 3 1 a inversa, obtida no PROC IML do SAS, é dada por: Comandos SAS A INVERSA 2 rows 2 3 2 cols 4 1 2 rows -0.1 0.3 2 cols 0.4 -0.2 proc iml; reset print; A={2 4, 3 1}; INVERSA=inv(A); 15 Uso da matriz inversa Se temos uma equação: AY C Assumindo que A tem inversa, podemos pré-multiplicar ambos os lados da igualdade por A-1: A 1AY A 1C Como A-1AY=IY=Y, obtemos a solução: Y A 1C Exemplo: suponha o seguinte sistema de equações: 2 y1 4 y2 20 3 y1 y2 10 Escrevendo na forma matricial temos: 16 2 4 y1 20 3 1 y 10 2 A solução do sistema de equações é dada por: 1 y1 2 4 20 y1 0.1 0.4 20 2 y 3 1 10 y 0.3 0.2 10 4 2 2 17 Determinantes Não daremos a definição geral de determinantes, por ser bastante complicado, mas veremos como se calculam os determinantes nos casos mais simples. Só há determinante de matriz quadrada e representa-se por: A Exemplo: 7 5 C 7x6 5x 4 22 4 6 18 No caso de uma matriz 3 x 3, o determinante é calculado pela regra de Sarrus a11 a12 a13 a21 a22 a23 a11a22 a33 a12 a23 a31 a13 a21a32 a31 a32 a33 - a13 a22 a31 a11a23 a32 a12 a21a33 Exemplo: 1 2 3 4 3 2 1.3.3 2.2.2 3.4.4 2.3.3 1.4.2 2.4.3 15 2 4 3 Para matrizes de maiores dimensões as regras, que não veremos, são mais complicadas. 19 Determinante de uma matriz singular Toda matriz quadrada singular tem determinante nulo; reciprocamente, é singular toda matriz de determinante nulo. Assim a matriz: 1 1 A A 1.2 1.2 0 2 2 É singular,isto é, não tem inversa. 20 Raízes próprias (auto valores ou ‘eigenvalues’) Seja a matriz 2 3 A 3 10 Consideremos a matriz: 3 2 3 1 0 2 A I 3 10 0 1 3 10 Tomemos agora a equação: A I 0 Isto é: 2 3 0 3 10 21 As raízes dessa equação são, por definição, as raízes próprias (ou ‘eigenvalues’) da matriz A. No exemplo, o determinante nos dá: 2 10 9 0 12 11 0 2 Esta equação nos dá as raízes: 1 11 2 1 22 Auto vetores ou ‘eigenvectors’) Definição: Dada A(n) real e simétrica, então todo vetor x tal que: A I x é auto-vetor, vetor próprio (‘eigenvector’) de A. Fato: auto vetores associados a auto vetores diferentes de uma A(n) real e simétrica são ortogonais. Exemplo: Seja a matriz 2 3 A 3 10 Para 1=11, temos: 23 A I X 3 X 1 0 2 1 3 10 11 X 0 2 9 3 X 1 0 3 1 X 0 2 9 X 1 3 X 2 0 3X1 X 2 0 Um auto vetor é: 2 x 6 24 Para 2=1, seguindo as mesmas etapas, obtemos o segundo auto vetor: 3 x 1 Norma Euclidiana Definição: define-se norma Euclidiana de um vetor u ao número real não negativo 1 2 1 u u' u 1/ 2 u u 2 . u1 ,u 2 ,...,u n . . u n 2 ui i 1 n 1 2 25 Exemplo: vamos considerar o primeiro auto vetor encontrado anteriormente: 1) 2 x 6 Para o vetor 1), a norma euclidiana vale: x xx ' 1/ 2 2 2 6 6 1 2 2 6 2 2 40 1 2 1 2 6,32 Vetor normalizado Definição: dizemos que um vetor u* está normalizado se: 1 u u u * 26 Exemplo: vamos considerar o primeiro auto vetor encontrado anteriormente: 1 1 2 0,3165 x x x 6,32 6 0,9494 * Observe que: 0,3165 x x 0,3165 0,9494 1 0,9494 *' * 27 Sistemas de equações lineares Sistemas de equações de primeiro grau, com qualquer número de incógnitas. Por exemplo: 3 X 1 2 X 2 8 8 X 1 X 2 15 X1 2 X 2 X 3 0 0 X1 X 2 3X 3 4 X 0 X 2 X 1 2 3 1 28 Em termos matriciais, podemos escrever: 3 2 X 1 8 8 1 X 15 2 1 2 1 X 1 0 0 1 3 X 4 2 1 0 2 X 3 1 Matrizes do sistema 29 Consideremos o sistema: 3 2 X 1 8 8 1 X 15 2 A X B Se A é não singular, isto é, que tenha inversa, A-1, então a solução do sistema é dado por: X A1 B Logo: 30 X 1 1 1 2 8 1 38 2 X X 2 19 8 3 15 19 19 1 Assim: X1 2 X2 1 É fácil compreender, portanto, que quando a matriz A é não singular, o sistema tem solução e essa solução é única. Mas para o estudo dos componentes principais interessam-nos sistemas de equações: AX Em que a matriz A seja singular e o segundo termo seja uma matriz nula. 31 Exemplo: X1 X 2 2 X 3 0 X1 X 2 X 3 0 3 X X 5 X 0 2 3 1 1 1 2 X 1 0 1 1 1 X 0 2 3 1 5 X 3 0 32 Equações lineares em que o segundo membro é nulo, se dizem homogêneas. Todo sistema de equações lineares homogêneas: AX tem solução, isto é, é compatível. Se a matriz A for não singular, a única solução possível é a solução nula: X 1 X 2 ... 0 X Esta solução geralmente não interessa. Mas se a matriz A for singular, o sistema de equações será indeterminado, isto é, terá infinitas soluções. Tal é o caso do sistema do nosso exemplo, pois a matriz 1 1 2 1 1 1 3 1 5 É singular 33 Para obter uma solução não nula, começamos por abandonar uma das equações e dar a uma das incógnitas um valor arbitrário não nulo. Por exemplo, abandonar a terceira equação e fazemos X3=1. Fica: X1 X 2 2 0 X1 X 2 1 0 X 1 X 2 2 X 1 X 2 1 Resolvendo este sistema, uma solução é: 3 X1 2 1 X2 2 X3 1 34 Matrizes de covariâncias e vetores de médias Amostras multivariadas podem ser resumidas por meio de vetores e matrizes de covariâncias. São definidas como segue. Suponha que temos p variáveis X1,X2,...,Xp e os valores dessas variáveis para a i-ésima observação, caso, em uma amostra são x1,x2,...,xp, respectivamente. Então a média amostral da variável j é: n x j xij / n i 1 s 2j xij x j A variância amostral é: n 2 n 1 i 1 A covariância entre as variáveis j e k é definida como: c jk xij x j xik xk n 1 n i 1 A covariância é uma medida do relacionamento linear entre duas variáveis. 35 O coeficiente de correlação para as variáveis j e k, rjk, está relacionado com a covariância pela expressão: rjk c jk s s j k Vetor de médias amostrais x1 x 2 ... x p 36 Matriz de variância-covariância amostral c11 c12 c 21 c22 . C . . . c p1 c p 2 Onde, . . c1 p . . c2 p . . . . . . . . c pp cii s 2 i Esta matriz quantifica a variabilidade presente nas variáveis, como também a correlação entre as mesmas. 37 Matriz de correlação amostral 1 r12 r 1 21 R ... ... rp1 rp 2 ... r1 p ... r2 p ... ... ... 1 Quando as variáveis X1,X2,...,Xp têm a mesma unidade e grandezas não muito diferentes, pode-se usar a matriz de variâncias-covariâncias. Caso contrário, é recomendado usar variáveis padronizadas, isto é, cada uma dividida pelo desvio padrão. Mas isto é equivalente a usar a matriz de correlação. 38 Alguns teoremas básicos Em muitas situações temos um vetor aleatório W, o qual é obtido prémultiplicando-se o vetor aleatório Y por uma matriz A (com valores fixos): W=AY. Temos os seguintes teoremas: E( A) A E( W) E ( AY) AE(Y) σ 2 ( W) 2 ( AY) A 2 (Y) A ' Exercício: considere, W1 1 1 Y1 W 1 1 Y 2 2 W A Y Mostre as expressões para E(W) e 2(W). 39