Álgebra matricial
Álgebra de matrizes é amplamente utilizada na estatística..
Matrizes
Matriz: um conjunto de elementos arranjados em linhas e colunas. Exemplo:
Linha 1 16 23
Linha 2 33 47
Linha 3  21 35
(Dimensão: 3 x 2)
 a11

A =  a 21
(3 x 2)  a
 31
a12 
a22 
a32 
i=1,2,3 (linhas)
j=1,2 (colunas)
Representada por letras em negrito, p.e., A, B, C, , , , , etc.
1
Matriz quadrada:
4 7 
3 9 


Vetor:
 a11
a
 21
 a31
a13 
a23 
a33 
a12
a22
a32
Número de linhas =
número de colunas.
Contém apenas uma coluna. Também são representados por letras
minúsculas em negrito.
4
Vetor linha ou transposto: B'  15 25 50
A   7 
10
Matriz transposta (A’):
A( 3 x 2 )
2 5 
 7 10


 3 4 
'
A ( 2 x 3)
2 7 3


5
10
4


Igualdade de matrizes: mesma dimensão e todos os correspondentes
elementos são iguais.
A=B implica:
a1  4
 a1 
A  a2 
(3 x 2)
 a3 
a2  7
4
B  7 
( 3 x1)
3
a3  3
2
Adição e subtração de matrizes:
 1 4
A   2 5


(3 x 2)
 3 6
 11
A  B  2  2
(3 x 2 )
 3  3
 11
A  B  2  2
(3 x 2 )
 3  3
 1 2
B   2 3


(3 x 2)
 3 4
4  2  2
5  3   4
6  4 6
4  2  0
5  3   0
6  4 0
Matrizes de mesma
dimensão
6
8 
10
2
2
2
3
Multiplicação de matrizes:
Por escalar:
2 7  8 28
4A  4 



9 3 36 12
4
Multiplicação de matriz por matriz:
2 5 4 6 (2.4  5.5) (2.6  5.8) 33 52
AB 
 






4
1
5
8
(
4
.
4

1
.
5
)
(
4
.
6

1
.
8
)
21
32
2 2 
2 2 
2 

2
Nota: geralmente ABBA.
Exercício: faça a multiplicação das matrizes:
1
AB  
0
3
5
 3
4  
5 .

8
  2
 

5
Tipos especiais de matrizes
Matriz simétrica: se A=A’ ela é dita simétrica. Exemplo:
1 4 6 
 4 2 5
A

3
3


6 5 3
1 4 6 
A '  4 2 5
6 5 3
6
Matriz diagonal: é uma matriz quadrada, cujos elementos fora da diagonal são
todos iguais a zero, por exemplo,
a1
A   0
 0
0
a2
0
0
0 
a3 
Dois tipos importantes de matrizes diagonal são: matriz identidade e matriz escalar.
Matriz identidade (I): é uma matriz diagonal cujos elementos da diagonal são
todos iguais a um (1).
Pré multiplicando (ou pós multiplicando) qualquer matriz A (r x r), pela
identidade, a matriz A fica inalterada.
1 0 0  a11
IA  0 1 0 a21
0 0 1 a31
a12
a22
a32
a13   a11
a23   a21
a33  a31
a12
a22
a32
a13 
a23 
a33 
Para uma matriz A de dimensão (r x r), temos:
AI  IA  A
7
Matriz escalar: é uma matriz diagonal cujos elementos da diagonal são todos
iguais. Pode ser dada por I:
 0 0 
1 0 0 
 0  0    0 1 0  I




 0 0  
0 0 1
Vetores e matrizes com todos os elementos iguais a um (1)
1
1

.
r 11   
.
.

1
1
1

r J r  .

.
1
1 . . 1
1 . . 1
. . . .

. . . .
1 . . 1
8
1
.
1'1  1 . . 1   n  n
.

1
Operações importantes:
1
1
.
1
11'   1 . . 1  
.
.


1

1
.
.
.
.
.
.
.
.
1
1
 n jn
.

1
9
Dependência linear e posto de uma matriz
Dependência linear
Considere a matriz:
1 2 5 1 
A  2 2 10 6
3 4 15 1
Observe que a terceira coluna é um múltiplo da primeira coluna:
5
1 
10  52
 
 
15
3
10
Portanto, as colunas da matriz A, são linearmente dependentes.
Elas contém informações redundantes (supérfluas), pois uma
coluna pode ser obtida como uma combinação linear das
outras.
Considere c vetores colunas de uma matriz (r x c) : C1,
C2,...,Cc.De modo geral, define-se dependência linear como:
• quando c escalares 1,..., c, nem todos iguais a zero, podem
ser determinados tal que:
1C1  2C2  ... cCc  0
 Os c vetores colunas são
linearmente dependentes
11
Se o único conjunto de escalares, para o qual a igualdade vale (=0) é:
1  0, 2  0,...,c  0
 Os c vetores colunas são
linearmente independentes
Exemplo: considere os escalares:1=5, 2=0, 3=-1e 4=0, assim temos:
 1   2   5  1   0 
52  0 2  110  0 6  0
3 4 15 1 0
Portanto, as colunas são linearmente dependentes. Observe que alguns ’s são
iguais a zero.
Posto (rank) de uma matriz
O posto de uma matriz é definida como sendo o número máximo de colunas (linhas)
linearmente independentes. No exemplo acima, encontramos 3 colunas (1,2 e 4)
linearmente independentes. Não existem escalares 1, 2 e 4 tal que 1C1+ 2C2+
4C4=0 a não ser estes: 1=0, 2=0 e 4=0. Assim, o posto de A é 3.
12
Segue-se que o posto de uma matriz (r x c) não pode exceder o min(r,c), isto é, o
mínimo entre r e c. No caso de uma matriz, por exemplo, C, que é o resultado do
produto de duas outras matrizes (A e B), o rank de C não pode exceder o mínimo
entre o rank(A) e o rank(B).
(Definição: o rank, posto ou característica de uma matriz, é o número de linhas
não nulas na sua forma escalonada canônica).
Exercício: seja a matriz
4 2 2
A  2 2 0
2 0 2
encontre o valor do rank de (A).
OBS. Matriz de rank incompleto
13
Inversa de uma matriz
Na álgebra de matrizes, a inversa de uma matriz A (quadrada), é
uma outra matriz, denominada por A-1, tal que:
1
A A  AA
1
I
Muitas matrizes quadradas não tem inversa. Para aquelas que
têm, a inversa é única.
14
Encontrando a inversa.
A inversa de uma matriz quadrada (r x r) existe se o rank da matriz é r. Esta matriz
é denominada de não singular ou de posto completo.Uma matriz (r x r) com rank
menor do que r é denominada de matriz singular ou de posto incompleto e não tem
inversa. A inversa de uma matriz (r x r) de rank completo também tem rank r.
Usaremos programas estatísticos ou matemáticos para encontrar inversas de
matrizes. Por exemplo, para a matriz:
 2 4
A

3 1 
a inversa, obtida no PROC IML do SAS, é dada por:
Comandos SAS
A
INVERSA
2 rows
2
3
2 cols
4
1
2 rows
-0.1
0.3
2 cols
0.4
-0.2
proc iml;
reset print;
A={2 4,
3 1};
INVERSA=inv(A);
15
Uso da matriz inversa
Se temos uma equação:
AY  C
Assumindo que A tem inversa, podemos pré-multiplicar ambos os lados da igualdade
por A-1:
A 1AY  A 1C
Como A-1AY=IY=Y, obtemos a solução:
Y  A 1C
Exemplo: suponha o seguinte sistema de equações:
2 y1  4 y2  20
3 y1  y2  10
Escrevendo na forma matricial temos:
16
2 4  y1  20
3 1  y   10

 2   
A solução do sistema de equações é dada por:
1
 y1  2 4 20  y1   0.1 0.4  20 2
 y   3 1 10   y    0.3  0.2 10  4
    2 
   
 2 
17
Determinantes
Não daremos a definição geral de determinantes, por ser bastante complicado,
mas veremos como se calculam os determinantes nos casos mais simples.
Só há determinante de matriz quadrada e representa-se por:
A
Exemplo:
7 5
C
 7x6  5x 4  22
4 6
18
No caso de uma matriz 3 x 3, o determinante é calculado pela regra de Sarrus
a11
a12
a13
a21
a22
a23  a11a22 a33  a12 a23 a31  a13 a21a32 
a31
a32
a33
- a13 a22 a31  a11a23 a32  a12 a21a33
Exemplo:
1 2 3
4 3 2  1.3.3  2.2.2  3.4.4  2.3.3  1.4.2  2.4.3  15
2 4 3
Para matrizes de maiores dimensões as regras, que não veremos, são mais
complicadas.
19
Determinante de uma matriz singular
Toda matriz quadrada singular tem determinante nulo; reciprocamente, é singular
toda matriz de determinante nulo. Assim a matriz:
1 1
A
 A  1.2  1.2  0

2 2
É singular,isto é, não tem inversa.
20
Raízes próprias (auto valores ou ‘eigenvalues’)
Seja a matriz
2 3 
A

3
10


Consideremos a matriz:
3 
2 3 
1 0 2  
A  I  
 




3
10
0
1
3
10





 

Tomemos agora a equação:
A  I  0
Isto é:
2
3
0
3
10  
21
As raízes dessa equação são, por definição, as raízes próprias (ou ‘eigenvalues’) da
matriz A.
No exemplo, o determinante nos dá:
2   10     9  0
  12  11  0
2
Esta equação nos dá as raízes:
1  11
2  1
22
Auto vetores ou ‘eigenvectors’)
Definição: Dada A(n) real e simétrica, então todo vetor x tal que:
 A  I x  
é auto-vetor, vetor próprio (‘eigenvector’) de A.
Fato: auto vetores associados a auto vetores diferentes de uma A(n) real e
simétrica são ortogonais.
Exemplo:
Seja a matriz
2 3 
A

3
10


Para 1=11, temos:
23
 A  I  X

3   X 1  0 
2  1
 3 10  11  X   0

 2   
  9 3   X 1  0 
 3  1  X   0

 2   
 9 X 1  3 X 2  0

 3X1  X 2  0
Um auto vetor é:
 2
x 
6 
24
Para 2=1, seguindo as mesmas etapas, obtemos o segundo auto vetor:
3
x 
 1
Norma Euclidiana
Definição: define-se norma Euclidiana de um vetor u ao número real não
negativo
1
2
1
 
u  u' u
1/ 2

u 

u  

 2 
. 


 u1 ,u 2 ,...,u n   
. 

 

 . 




u
 n 


2
  ui 
 i 1 
n
1
2
25
Exemplo: vamos considerar o primeiro auto vetor encontrado anteriormente:
1)
 2
x 
6 
Para o vetor 1), a norma euclidiana vale:
 
x  xx
'
1/ 2

 2

 2 
6  
6  
1
2

 2 6
2
2
  40
1
2
1
2
 6,32
Vetor normalizado
Definição: dizemos que um vetor u* está normalizado se:
1
u 
u
u
*
26
Exemplo: vamos considerar o primeiro auto vetor encontrado anteriormente:
1
1 2 0,3165
x 
x



x
6,32 6 0,9494
*
Observe que:
0,3165
x x  0,3165 0,9494
1

0,9494
*'
*
27
Sistemas de equações lineares
Sistemas de equações de primeiro grau, com qualquer número de incógnitas.
Por exemplo:
3 X 1  2 X 2  8

8 X 1  X 2  15
 X1  2 X 2  X 3  0

 0 X1  X 2  3X 3  4
 X  0 X  2 X  1
2
3
 1
28
Em termos matriciais, podemos escrever:
3 2   X 1   8 
8  1  X   15

 2   
1  2 1   X 1   0 
0 1





3
X

4
2

   
1 0  2  X 3   1
Matrizes do sistema
29
Consideremos o sistema:
3 2   X 1   8 
8  1  X   15

 2   
A
X
B
Se A é não singular, isto é, que tenha inversa, A-1, então a solução do sistema é
dado por:
X  A1 B
Logo:
30
 X 1  1 1 2   8  1 38 2
X   
   



 X 2  19 8  3 15 19 19 1
Assim:
X1  2
X2 1
É fácil compreender, portanto, que quando a matriz A é não singular, o sistema
tem solução e essa solução é única. Mas para o estudo dos componentes principais
interessam-nos sistemas de equações:
AX  
Em que a matriz A seja singular e o segundo termo seja uma matriz nula.
31
Exemplo:
 X1  X 2  2 X 3  0

 X1  X 2  X 3  0
3 X  X  5 X  0
2
3
 1
1 1 2  X 1  0
1  1 1   X   0

 2   
3 1 5  X 3  0
32
Equações lineares em que o segundo membro é nulo, se dizem homogêneas.
Todo sistema de equações lineares homogêneas:
AX  
tem solução, isto é, é compatível. Se a matriz A for não singular, a única
solução possível é a solução nula:
X 1  X 2  ...  0
X 
Esta solução geralmente não interessa. Mas se a matriz A for singular, o
sistema de equações será indeterminado, isto é, terá infinitas soluções. Tal é o
caso do sistema do nosso exemplo, pois a matriz
1 1 2
1  1 1 


3 1 5 
É singular
33
Para obter uma solução não nula, começamos por abandonar uma das
equações e dar a uma das incógnitas um valor arbitrário não nulo. Por
exemplo, abandonar a terceira equação e fazemos X3=1. Fica:
 X1  X 2  2  0

 X1  X 2  1  0
 X 1  X 2  2

 X 1  X 2  1
Resolvendo este sistema, uma solução é:
3
X1 
2
1
X2 
2
X3 1
34
Matrizes de covariâncias e vetores de médias
Amostras multivariadas podem ser resumidas por meio de vetores e matrizes de
covariâncias. São definidas como segue. Suponha que temos p variáveis X1,X2,...,Xp e
os valores dessas variáveis para a i-ésima observação, caso, em uma amostra são
x1,x2,...,xp, respectivamente. Então a média amostral da variável j é:
n
x j   xij / n
i 1
s 2j   xij  x j 
A variância amostral é:
n
2
n  1
i 1
A covariância entre as variáveis j e k é definida como:
c jk   xij  x j xik  xk  n  1
n
i 1
A covariância é uma medida do relacionamento linear entre duas variáveis.
35
O coeficiente de correlação para as variáveis j e k, rjk, está
relacionado com a covariância pela expressão:
rjk 
c jk
s s 
j k
Vetor de médias amostrais
 x1 
x 
 2
 ... 
 
 x p 
36
Matriz de variância-covariância amostral
 c11 c12
c
 21 c22
.
C .

.
 .
c p1 c p 2

Onde,
. . c1 p 
. . c2 p 
. . . 

. . . 
. . c pp 
cii  s
2
i
Esta matriz quantifica a variabilidade presente nas variáveis, como também a
correlação entre as mesmas.
37
Matriz de correlação amostral
 1 r12
r
1
21
R
 ... ...

rp1 rp 2
... r1 p 

... r2 p 
... ... 

... 1 
Quando as variáveis X1,X2,...,Xp têm a mesma unidade e grandezas não muito
diferentes, pode-se usar a matriz de variâncias-covariâncias. Caso contrário, é
recomendado usar variáveis padronizadas, isto é, cada uma dividida pelo desvio
padrão. Mas isto é equivalente a usar a matriz de correlação.
38
Alguns teoremas básicos
Em muitas situações temos um vetor aleatório W, o qual é obtido prémultiplicando-se o vetor aleatório Y por uma matriz A (com valores
fixos): W=AY. Temos os seguintes teoremas:
E( A)  A
E( W)  E ( AY)  AE(Y)
σ 2 ( W)   2 ( AY)  A 2 (Y) A '
Exercício: considere,
W1  1  1 Y1 
W   1 1  Y 
  2
 2 
W
A
Y
Mostre as expressões para E(W) e 2(W).
39
Download

de uma matriz