00TD02A Matrixkalkulus - itnett/FTD02H-N GitHub Wiki
Matrixkalkulus Forklart på Norsk og Engelsk
§D.1 Derivater av Vektorfunksjoner
Norsk: La ( x ) og ( y ) være vektorer av orden n og m henholdsvis:
[ x = \begin{bmatrix} x_1 \ x_2 \ \vdots \ x_n \end{bmatrix}, \quad y = \begin{bmatrix} y_1 \ y_2 \ \vdots \ y_m \end{bmatrix} ]
hvor hver komponent ( y_i ) kan være en funksjon av alle ( x_j ). Dette representerer at ( y ) er en funksjon av ( x ), eller ( y = y(x) ).
Engelsk: Let ( x ) and ( y ) be vectors of orders n and m respectively:
[ x = \begin{bmatrix} x_1 \ x_2 \ \vdots \ x_n \end{bmatrix}, \quad y = \begin{bmatrix} y_1 \ y_2 \ \vdots \ y_m \end{bmatrix} ]
where each component ( y_i ) may be a function of all the ( x_j ), represented by saying that ( y ) is a function of ( x ), or ( y = y(x) ).
§D.1.1 Derivert av en Vektor med hensyn til en Vektor
Norsk: Derivaten av vektoren ( y ) med hensyn til vektoren ( x ) er en n × m matrise:
[ \frac{\partial y}{\partial x} = \begin{bmatrix} \frac{\partial y_1}{\partial x_1} & \frac{\partial y_2}{\partial x_1} & \cdots & \frac{\partial y_m}{\partial x_1} \ \frac{\partial y_1}{\partial x_2} & \frac{\partial y_2}{\partial x_2} & \cdots & \frac{\partial y_m}{\partial x_2} \ \vdots & \vdots & \ddots & \vdots \ \frac{\partial y_1}{\partial x_n} & \frac{\partial y_2}{\partial x_n} & \cdots & \frac{\partial y_m}{\partial x_n} \end{bmatrix} ]
Engelsk: The derivative of the vector ( y ) with respect to vector ( x ) is the n × m matrix:
[ \frac{\partial y}{\partial x} = \begin{bmatrix} \frac{\partial y_1}{\partial x_1} & \frac{\partial y_2}{\partial x_1} & \cdots & \frac{\partial y_m}{\partial x_1} \ \frac{\partial y_1}{\partial x_2} & \frac{\partial y_2}{\partial x_2} & \cdots & \frac{\partial y_m}{\partial x_2} \ \vdots & \vdots & \ddots & \vdots \ \frac{\partial y_1}{\partial x_n} & \frac{\partial y_2}{\partial x_n} & \cdots & \frac{\partial y_m}{\partial x_n} \end{bmatrix} ]
§D.1.2 Derivert av en Skalar med hensyn til en Vektor
Norsk: Hvis ( y ) er en skalar:
[ \frac{\partial y}{\partial x} = \begin{bmatrix} \frac{\partial y}{\partial x_1} \ \frac{\partial y}{\partial x_2} \ \vdots \ \frac{\partial y}{\partial x_n} \end{bmatrix} ]
Engelsk: If ( y ) is a scalar:
[ \frac{\partial y}{\partial x} = \begin{bmatrix} \frac{\partial y}{\partial x_1} \ \frac{\partial y}{\partial x_2} \ \vdots \ \frac{\partial y}{\partial x_n} \end{bmatrix} ]
§D.1.3 Derivert av en Vektor med hensyn til en Skalar
Norsk: Hvis ( x ) er en skalar:
[ \frac{\partial y}{\partial x} = \begin{bmatrix} \frac{\partial y_1}{\partial x} & \frac{\partial y_2}{\partial x} & \cdots & \frac{\partial y_m}{\partial x} \end{bmatrix} ]
Engelsk: If ( x ) is a scalar:
[ \frac{\partial y}{\partial x} = \begin{bmatrix} \frac{\partial y_1}{\partial x} & \frac{\partial y_2}{\partial x} & \cdots & \frac{\partial y_m}{\partial x} \end{bmatrix} ]
§D.1.4 Jacobian av en Variabeltransformasjon
Norsk: I multivariat analyse, hvis ( x ) og ( y ) er av samme orden, kalles determinanten til kvadratmatrisen ( \partial x / \partial y ):
[ J = \left| \frac{\partial x}{\partial y} \right| ]
Jacobian av transformasjonen bestemt av ( y = y(x) ). Den inverse determinanten er:
[ J^{-1} = \left| \frac{\partial y}{\partial x} \right| ]
Engelsk: In multivariate analysis, if ( x ) and ( y ) are of the same order, the determinant of the square matrix ( \partial x / \partial y ) is called the Jacobian of the transformation determined by ( y = y(x) ):
[ J = \left| \frac{\partial x}{\partial y} \right| ]
The inverse determinant is:
[ J^{-1} = \left| \frac{\partial y}{\partial x} \right| ]
Eksempel på Jacobian (Norsk og Engelsk)
Norsk: Transformasjonen fra sfæriske til kartesiske koordinater er definert som:
[ x = r \sin \theta \cos \psi, \quad y = r \sin \theta \sin \psi, \quad z = r \cos \theta ]
For å oppnå Jacobian av transformasjonen:
[ J = \left| \frac{\partial x}{\partial y} \right| = \left| \begin{array}{ccc} \sin \theta \cos \psi & \sin \theta \sin \psi & \cos \theta \ r \cos \theta \cos \psi & r \cos \theta \sin \psi & -r \sin \theta \ -r \sin \theta \sin \psi & r \sin \theta \cos \psi & 0 \end{array} \right| = r^2 \sin \theta ]
Engelsk: The transformation from spherical to Cartesian coordinates is defined by:
[ x = r \sin \theta \cos \psi, \quad y = r \sin \theta \sin \psi, \quad z = r \cos \theta ]
To obtain the Jacobian of the transformation:
[ J = \left| \frac{\partial x}{\partial y} \right| = \left| \begin{array}{ccc} \sin \theta \cos \psi & \sin \theta \sin \psi & \cos \theta \ r \cos \theta \cos \psi & r \cos \theta \sin \psi & -r \sin \theta \ -r \sin \theta \sin \psi & r \sin \theta \cos \psi & 0 \end{array} \right| = r^2 \sin \theta ]
§D.2 Kjederegelen for Vektorfunksjoner
Norsk: La ( x ), ( y ) og ( z ) være vektorer, der ( z ) er en funksjon av ( y ), som igjen er en funksjon av ( x ):
[ x = \begin{bmatrix} x_1 \ x_2 \ \vdots \ x_n \end{bmatrix}, \quad y = \begin{bmatrix} y_1 \ y_2 \ \vdots \ y_r \end{bmatrix}, \quad z = \begin{bmatrix} z_1 \ z_2 \ \vdots \ z_m \end{bmatrix} ]
Bruk definisjonen ( y = y(x) ) og ( z = z(y) ):
[ \frac{\partial z}{\partial x} = \frac{\partial y}{\partial x} \frac{\partial z}{\partial y} ]
Engelsk: Let ( x ), ( y ), and ( z ) be vectors, where ( z ) is a function of ( y ), which is in turn a function of ( x ):
[ x = \begin{bmatrix} x_1 \ x_2 \ \vdots \ x_n \end{bmatrix}, \quad y = \begin{bmatrix} y_1 \ y_2 \
\vdots \ y_r \end{bmatrix}, \quad z = \begin{bmatrix} z_1 \ z_2 \ \vdots \ z_m \end{bmatrix} ]
Using the definitions ( y = y(x) ) and ( z = z(y) ):
[ \frac{\partial z}{\partial x} = \frac{\partial y}{\partial x} \frac{\partial z}{\partial y} ]
§D.3 Derivert av Skalarfunksjoner av en Matrise
Norsk: La ( X = (x_{ij}) ) være en matrise av orden (m × n) og la:
[ y = f(X) ]
være en skalarfunksjon av ( X ). Derivaten av ( y ) med hensyn til ( X ) er definert som:
[ \frac{\partial y}{\partial X} = \begin{bmatrix} \frac{\partial y}{\partial x_{11}} & \frac{\partial y}{\partial x_{12}} & \cdots & \frac{\partial y}{\partial x_{1n}} \ \frac{\partial y}{\partial x_{21}} & \frac{\partial y}{\partial x_{22}} & \cdots & \frac{\partial y}{\partial x_{2n}} \ \vdots & \vdots & \ddots & \vdots \ \frac{\partial y}{\partial x_{m1}} & \frac{\partial y}{\partial x_{m2}} & \cdots & \frac{\partial y}{\partial x_{mn}} \end{bmatrix} ]
Engelsk: Let ( X = (x_{ij}) ) be a matrix of order (m × n) and let:
[ y = f(X) ]
be a scalar function of ( X ). The derivative of ( y ) with respect to ( X ) is defined as:
[ \frac{\partial y}{\partial X} = \begin{bmatrix} \frac{\partial y}{\partial x_{11}} & \frac{\partial y}{\partial x_{12}} & \cdots & \frac{\partial y}{\partial x_{1n}} \ \frac{\partial y}{\partial x_{21}} & \frac{\partial y}{\partial x_{22}} & \cdots & \frac{\partial y}{\partial x_{2n}} \ \vdots & \vdots & \ddots & \vdots \ \frac{\partial y}{\partial x_{m1}} & \frac{\partial y}{\partial x_{m2}} & \cdots & \frac{\partial y}{\partial x_{mn}} \end{bmatrix} ]
Eksempel på Derivert av Skalarfunksjoner av en Matrise (Norsk og Engelsk)
Norsk: Finn gradientmatrisen hvis ( y ) er sporet av en kvadratisk matrise ( X ) av orden n, det vil si:
[ y = tr(X) = \sum_{i=1}^n x_{ii} ]
Derivaten er:
[ \frac{\partial y}{\partial X} = I ]
hvor ( I ) er identitetsmatrisen av orden n.
Engelsk: Find the gradient matrix if ( y ) is the trace of a square matrix ( X ) of order n, that is:
[ y = tr(X) = \sum_{i=1}^n x_{ii} ]
The derivative is:
[ \frac{\partial y}{\partial X} = I ]
where ( I ) is the identity matrix of order n.
Jeg har forklart de første delene av dokumentet "Matrix Calculus" på både norsk og engelsk. La oss fortsette med resten av de relevante seksjonene fra vedlegget.
§D.4 Matrisens Differensial
Norsk: For en skalarfunksjon ( f(x) ), der ( x ) er en n-vektor, er det ordinære differensialet av multivariat kalkulus definert som:
[ df = \sum_{i=1}^n \frac{\partial f}{\partial x_i} dx_i ]
I tråd med denne formelen definerer vi differensialet til en m × n matrise ( X = [x_{ij}] ) som:
[ dX \triangleq \begin{bmatrix} dx_{11} & dx_{12} & \cdots & dx_{1n} \ dx_{21} & dx_{22} & \cdots & dx_{2n} \ \vdots & \vdots & \ddots & \vdots \ dx_{m1} & dx_{m2} & \cdots & dx_{mn} \end{bmatrix} ]
Denne definisjonen samsvarer med de multiplikative og assosiative reglene:
[ d(\alpha X) = \alpha dX, \quad d(X + Y) = dX + dY ]
Hvis ( X ) og ( Y ) er produktkonforme matriser, kan det verifiseres at differensialet av deres produkt er:
[ d(XY) = (dX)Y + X(dY) ]
som er en utvidelse av den velkjente regelen ( d(xy) = y dx + x dy ) for skalarfunksjoner.
Engelsk: For a scalar function ( f(x) ), where ( x ) is an n-vector, the ordinary differential of multivariate calculus is defined as:
[ df = \sum_{i=1}^n \frac{\partial f}{\partial x_i} dx_i ]
In harmony with this formula, we define the differential of an m × n matrix ( X = [x_{ij}] ) to be:
[ dX \triangleq \begin{bmatrix} dx_{11} & dx_{12} & \cdots & dx_{1n} \ dx_{21} & dx_{22} & \cdots & dx_{2n} \ \vdots & \vdots & \ddots & \vdots \ dx_{m1} & dx_{m2} & \cdots & dx_{mn} \end{bmatrix} ]
This definition complies with the multiplicative and associative rules:
[ d(\alpha X) = \alpha dX, \quad d(X + Y) = dX + dY ]
If ( X ) and ( Y ) are product-conforming matrices, it can be verified that the differential of their product is:
[ d(XY) = (dX)Y + X(dY) ]
which is an extension of the well-known rule ( d(xy) = y dx + x dy ) for scalar functions.
Eksempler på Matrisens Differensial (Norsk og Engelsk)
Norsk: Hvis ( X = [x_{ij}] ) er en kvadratisk nonsingulær matrise av orden n, og betegner ( Z = |X|X^{-1} ). Finn differensialet til determinanten av ( X ):
[ d|X| = \sum_{i,j} \frac{\partial |X|}{\partial x_{ij}} dx_{ij} = \sum_{i,j} X_{ij} dx_{ij} = tr(|X|X^{-1})^T dX) = tr(Z^T dX) ]
Engelsk: If ( X = [x_{ij}] ) is a square nonsingular matrix of order n, and denote ( Z = |X|X^{-1} ). Find the differential of the determinant of ( X ):
[ d|X| = \sum_{i,j} \frac{\partial |X|}{\partial x_{ij}} dx_{ij} = \sum_{i,j} X_{ij} dx_{ij} = tr(|X|X^{-1})^T dX) = tr(Z^T dX) ]
Norsk: Med de samme antakelsene som ovenfor, finn ( d(X^{-1}) ). Den raskeste utledningen følger ved å differensiere begge sider av identiteten ( X^{-1}X = I ):
[ d(X^{-1})X + X^{-1} dX = 0 ]
hvorfra
[ d(X^{-1}) = -X^{-1} dX X^{-1} ]
Hvis ( X ) reduseres til skalaren ( x ), har vi:
[ d\left( \frac{1}{x} \right) = -\frac{dx}{x^2} ]
Engelsk: With the same assumptions as above, find ( d(X^{-1}) ). The quickest derivation follows by differentiating both sides of the identity ( X^{-1}X = I ):
[ d(X^{-1})X + X^{-1} dX = 0 ]
from which
[ d(X^{-1}) = -X^{-1} dX X^{-1} ]
If ( X ) reduces to the scalar ( x ), we have:
[ d\left( \frac{1}{x} \right) = -\frac{dx}{x^2} ]
Dette fullfører gjennomgangen av de mest relevante delene av dokumentet. Hvis du trenger flere detaljer eller forklaringer om spesifikke deler, vennligst gi beskjed!