Modulo I: (b) Matrices - leangior/MAP GitHub Wiki

Matemática Aplicada (Introducción a la Modelación Matemática en Cs. Ambientales)

  • Comisión Ecología: Dr. Leandro Giordano / Prof. Silvana Ávila

Módulo I: Sistemas de Ecuaciones Lineales y Modelos Matriciales

Objetivo

  • Aprender a formular y operar modelos matemáticos para la estimación de magnitudes físicas, ecológicas o demográficas, mediante el uso de sistemas de ecuaciones lineales y su representación matricial

Aplicaciones

  1. Hallar el conjunto soluciones posibles para un sistema de ecuaciones lineales que caracteriza una situación específica en tiempo o espacio [modelos estáticos]

    • Ejemplos: Estimar la distribución de individuos de distintas poblaciones en distintos sitios de acuerdo al stock disponible en cada sitio y a la cantidades necesarias por cada individuo de la población, interpolación espacial o temporal de valores de magnitudes físicas o ambientales formulando los correspondientes sistemas de ecuaciones lineales para determinar coeficientes de polinomios o planos (e.g. considerando la variación de estas magnitudes sobre una transecta o sobre una superficie)
  1. Formular modelos dinámicos en tiempo discreto y evaluar su operación [modelos dinámicos]

    • Ejemplos: Identificar la estructura de un sistema demográfico y formular las ecuaciones lineales que representan la dinámica del tránsito de una cohorte, identificando la matriz de transición del sistema y, de ahí, realizar proyecciones fundadas sobre la evolución del sistema (e.g. concepto de autovalor)
  1. Formular y operar sistemas discretos lineales para la representación de fenómenos de propagación o tránsito de una señal [funciones de transferencia de sistemas lineales]

    • Ejemplos: Simular la propagación del vuelco de una sustancia contaminante entre 2 puntos situados en una red de drenaje o simular el tránsito de hidrogramas

Matrices

¿Por qué y para qué?

Si se analiza el método de eliminación puede apreciarse que se modifican los coeficientes que afectan las incógnitas, así como los términos independientes, a fin de obtener un vector solución. Como ya se ha mostrado, este método se apoya en los dos principios básicos de la linealidad matemática (proporcionalidad y aditividad). Por otro lado, cualquiera podría comprobar que a medida que se incrementan las dimensiones del sistema de ecuaciones (el número de ecuaciones o de incógnitas), el tiempo necesario para la realización de cómputos también se incrementa, quizás aun de forma más notoria. Luego, surge un interrogante

¿Existirá alguna entidad matemática que disponga de un Álgebra definida de forma tal que permita simplificar la expresión formal y la resolución de sistemas de ecuaciones lineales? o dicho de otro modo, que una vez formulado un modelo matemático mediante un SEL permita ejecutar operaciones siguiendo un conjunto de simples reglas que permitan hallar su solución (y de esta forma poder programar estos procedimientos)

Así como los números son entidades matemáticas con un Álgebra definida que nos permite resolver ecuaciones lineales de forma muy simplificada (e.g. $x=\dfrac{a}{b}$ para la ecuación lineal $ax=b$), las matrices son entidades matemáticas que de acuerdo a las reglas de su Álgebra nos permitirán representar SELs de forma simplificada, pudiendo realizar operaciones formales y ejecutar procedimientos de búsqueda de soluciones de manera más económica.

Asimismo, como se viene realizando en el marco de este taller, la perspectiva que adoptaremos para la definición de estas entidades y las reglas de operación será desde las ciencias fácticas o de datos.

Estructura de una matriz

Entenderemos a toda matriz como un arreglo de números (datos) en m filas y n columnas. Asimismo, se introduce la notación: por un lado la simplificada, en la cual las matrices se repesentan por letras mayúsculas en negrita y, por otro lado, la expandida para la cual sus componentes o entradas se representan con la misma letra en minúscula y se les asigna dos subíndices, indicando la situación (fila y columna). Así, si A es una matriz, luego su representación matemática queda dada mediante la siguiente igualdad:

$$\mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & . & . &. & a_{1j} & . & . & . & a_{1n} \\ a_{21} & a_{22} & . & . &. & a_{2j} & . & . & . & a_{2n} \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ a_{i1} & a_{i2} & . & . &. & a_{ij} & . & . & . & a_{in} \\ . & . & & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ a_{m1} & a_{n2} & . & . &. & a_{mj} & . & . & . & a_{mn} \\ \end{bmatrix}$$

Asimismo, $a_{ij}$ es la entrada (el valor del elemento) correspodiente a la i-ésima fila y j-ésima columna. Las dimensiones de la matriz quedan determinadas por el número de m filas y n columnas. Luego, diremos que A es una matriz de mxn. Para el caso que n=m, diremos que la matriz es cuadrada. A la vez, como se introdujo en la sección de SELs, podemos observar que tanto las columnas como las filas están compuestas por una sucesión ordenada de valores reales, de manera tal que los definiremos respectivamente como vectores fila y vectores columna de la matriz. En otras palabras, siguiendo la notación propuesta, toda matriz está compuesta por una cantidad de:

  • m vectores fila compuestos por n elementos (n-vectores, ver definición de p-vector más abajo)

  • n vectores columna compuestos por m elementos (m-vectores, ver definición de p-vector más abajo)

  • Así, el i-ésimo vector fila ai de la matriz A estará compuesto por los siguientes elementos:

$$\begin{align} \mathbf{a_i}=\begin{bmatrix} a_{i1} & a_{i2} & . & . & . & a_{ij} & . & . & . & a_{in}\end{bmatrix} \end{align}$$

  • Mientras el j-ésimo vector columna aj lo estará mediante:

$$\begin{align} \mathbf{a_j}=\begin{bmatrix} a_{1j} \\ a_{2j} \\ . \\ . \\ . \\ a_{ij} \\ . \\ . \\ a_{mj} & \end{bmatrix} \end{align}$$

Desde otro punto de vista, podemos advertir que los vectores fila a i y columna b j, son matrices de 1xn y mx1, respectivamente. Cualquier matriz de dimensiones 1xn recibe la denominación de n-vector (un vector con n componentes), así como cualquier matriz de mx1 recibe la denominación de m-vector (un vector con m componentes). Más genéricamente, en el desarrollo de este taller, un **p-vector será un vector ** (fila o columna) con p componentes (valores reales ordenados).

Álgebra de Matrices (operaciones fundamentales)

1. Suma

La primer operación que debe introducirse apra la definición del Álgebra es la suma.

Sean A y B dos matrices cualquiera, ambas con igual dimensión de m filas y n columnas, se define la operación suma de matrices A+B=C, cuya operación relaciona las entradas de A y B, para la obtención de las entradas de C de la siguiente manera:

$$\begin{align} a_{ij}+b_{ij}=c_{ij} \end{align}$$

En otas palabras, se suman las entradas de cada matriz A y B, de acuerdo a su situación de fila y columna, para obtener la entrada correspondiente en la matriz C. La suma es conmutativa,d e manera tal que A+B=B+A=C (esto puede demostrarse dado que ambas matrices tienen ídem dimensiones).

Ejemplo 1. Así, por ejemplo, sean A y B matrices de 2x3:

$$\begin{align} \mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{bmatrix} \; \; \mathbf{B} = \begin{bmatrix} b_{11} & b_{12} & b_{13} \\ b_{21} & b_{22} & b_{23} \end{bmatrix} \end{align}$$

la matriz C=A+B estará constituída por

$$\begin{align} \mathbf{C} = \begin{bmatrix} c_{11} & c_{12} & c_{13} \\ c_{21} & c_{22} & c_{23} \end{bmatrix}= \begin{bmatrix} a_{11} + b_{11} & a_{12} + b_{12} & a_{13} + b_{13} \\ a_{21} + b_{21} & a_{22} + b_{22} & a_{22} + b_{23} \end{bmatrix} \end{align}$$

2. Multiplicación por un escalar

Una vez definida la suma, puede introducirse la operación producto por un número real k cualquiera.

Intuitivamente podemos pensar que multiplicar una matriz A por un número real k equivale a sumar esta matriz k veces (de ahí que se produzca escalamiento), de manera semejante a como se define para el conjunto de números reales. Además, resulta evidente que la operación así definida satisface la restricción precedente de la definición adoptada en la suma (igual dimensión, pues A posee las mismas dimensiones que A).

Luego digamos, sea k un valor escalar (un número real cualquiera) y A una matriz de m filas y n columnas, el producto kA=C se define mediante la operación

$$k.a_{ij}=c_{ij}$$

Esto es, sencillamente se multiplica cada una de las entradas de la matriz A por el escalar para obtener las entradas correspondientes de la matriz C resultante.

Ejemplo 2. Así considerando la matriz A del ejemplo 1 y un valor escalar k, resulta:

$$\begin{align} \mathbf{C} = \begin{bmatrix} c_{11} & c_{12} & c_{13} \\ c_{21} & c_{22} & c_{23} \end{bmatrix}= \begin{bmatrix} k.a_{11} & k.a_{12} & k.a_{13} \\ k.a_{21} & k.a_{21} & k.a_{23} \end{bmatrix}=k \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{21} & a_{23} \end{bmatrix} \end{align}$$

El producto por un escalar cumple con la propiedades distributiva (para la suma de 2 o más matrices) k(A+B)=kA+kB y asociativa,d e modo tal que si k y d son dos escalares k(dA)=(kd)A.

Por otro lado, combinando el producto por un escalar con la suma, considerando n sumandos puede introducirse el concepto y operación de combinación lineal. Así, sean A1,A2,...,An n matrices de dimensiones iguales y sean k1,k2,...,kn n escalares que afecten a cada una de las matrices mediante el producto, una combinación lineal queda dada mediante:

$$\begin{align} k_1\mathbf{A_1}+k_2\mathbf{A_2}+...+k_n\mathbf{A_n}=\sum_{i=1}^{n} k_i \mathbf{A_i} \end{align}$$

3. Resta

Definida la suma y el producto por un escalar puede introducirse la resta. Esto es, sean A y B 2 matrices de m filas y n columnas, la resta se define mediante la operación A+(-1)B=C, esto es

$$a_{ij}+(-1)b_{ij}=c_{ij}$$

En otras palabras, se restan las entradas situadas en la misma fila y columna de cada una de las 2 matrices A y B para obtener las entradas correspondientes de la matriz C.

4. Transposición (Matriz Transpuesta)

Sea A una matriz de m filas y n columnas (mxn), definimos a la matriz transpuesta AT como la resultante de la operación de transposición sobre todas las entradas de A, la cual establece (el operador $[.]^T$ indica la transpocición sobre la entrada)

$$[a_{ij}]^T=[a_{ji}]$$

Así se establece que para cualquier entrada $a_{ij}$ de la matriz, la aplicación del operador de transposición $[a_{ij}]^T$ invierte el orden de los subíndices, de tal forma que cada entrada de de la matriz A correspondiente a la i-ésima fila (con $i=1,...,m$) y j-ésima columna (con $j=1,...,n$) se le asigna la j-ésima fila y la i-ésima columna de la matriz transpuesta AT.

Sintéticamente, la matriz resultante AT se obtiene al intercambiar los vectores fila de A por los vectores columna. En consecuencia, si las dimensiones de la matriz A son mxn, AT tendrá dimensiones nxm.

Ejemplo 3. Condierando la matriz de 2 x 3 del ejemplo 1

$$\begin{align} \mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{bmatrix} \end{align}$$

Como se ejemplifica a continuación, la operación de transposición resultaría en la matriz AT, de dimensiones 3x2, cumpliéndose las siguientes igualdades

$$\begin{align} \mathbf{A^T} = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{bmatrix}^T= \begin{bmatrix} a_{11} & a_{21} \\ a_{12} & a_{22} \\ a_{13} & a_{23} \\ \end{bmatrix} \end{align}$$

Una aplicación importante de la operación de transposición es la capacidad de rotar en 90° p-vectores. Puesto como veremos a continuación, la definición del producto punto (necesaria para introducir el producto matricial y, de ahí la formulación matricial de un SEL) así lo requiere que los vectores invoilucrados sean ortogonales (un vector fila y un vector columna).

Ejemplo 4. Sea ai un p-vector fila (1xp)

$$\begin{align} \mathbf{a_i}=\begin{bmatrix} a_{i1} & a_{i2} & . & . & . & a_{ij} & . & . & a_{ip}\end{bmatrix} \end{align}$$

la operación (ai)T lo rota y lo transforma en un p-vector columna (px1)

$$\begin{align} \mathbf{(a_i)^T}=\begin{bmatrix} a_{i1} \\ a_{i2} \\ . \\ . \\ . \\ a_{ij} \\ . \\ . \\ a_{ip} \end{bmatrix} \end{align}$$

5. Producto punto

Sean a y b p-vectores fila (1xp) y columna (px1), respectivamente. Definimos al producto punto ab como la combinación lineal de asignar a cada k-ésimo elemento de b el k-ésimo correspodiente de a. Esto es:

$$\begin{align} \mathbf{ab}=a_{11}b_{11}+a_{12}b_{21}+...+a_{1j}b_{j1}+...+a_{1p}b_{p1}=\sum_{k=1}^{p} a_{1k}b_{k1} \end{align}$$

Ejemplo 5. Sean $\mathbf{a}$ y $\mathbf{b}$ los siguientes 3-vectores fila y columna:

$$\begin{align} \mathbf{a}=\begin{bmatrix} a_{11} & a_{12} & a_{13} \\ \end{bmatrix} \; \; \mathbf{b}=\begin{bmatrix} b_{11} \\ b_{21} \\ b_{31} \end{bmatrix} \end{align}$$

Luego, ab será

$$\begin{align} \mathbf{ab}=a_{11}b_{11} + a_{12}b_{21} + a_{13}b_{31}=c \end{align}$$

6. Producto de matrices

Definido el producto punto entre vectores fila y columna se puede introducir el producto entre 2 matrices A.B=C. Específicamente, la entrada cij de la i-ésima fila y j-ésima columna de la matriz de dimensiones mxn, obtenida por el producto de 2 matrices A de dimensiones mxp y B de dimensiones pxn, corresponde al producto punto del i-ésimo vector fila de A y el j-ésimo vector columna de B.

$$\begin{align} c_{ij}=\sum_{k=1}^{p} a_{ik}b_{kj} \end{align}$$

El procedimiento establece que para obtener la entrada c11, de la matriz resultante A.B=C, deberá realizarse el producto punto entre la fila 1 de la matriz A (p-vector fila) y la columna 1 (p-vector columna) de la matriz B. Luego, para obtener c12 se realizará el producto punto de la fila 1 de A por la columna 2 de B, y así evaluando el producto punto de todas las filas de A con las columnas de B. En suma, se procederá realizando el producto punto de todas las filas de A por todas las columnas de B, para finalmente obtener C.

De acuerdo a las reglas del producto punto, las cuales hereda el producto matricial, puede notarse:

  • Para que la operación pueda realizarse los vectores fila de A deben tener la misma cantidad de componentes (dimensión) que los vectores columna de B (pues cada entrada implica el producto punto de estos). O lo que es lo mismo, la cantidad de columnas de A debe ser la misma que la cantidad de filas en B (ambos deben ser p-vectores).
  • Es por esto que se establece que las dimensiones de A deben ser mxp y de B deben ser pxn
  • Así, es evidente que la matriz resultante C tendrá dimensiones mxn.
  • Asimismo, el producto por definición no es conmutable. Esto es, la conmutación no puede aplicarse en todos los casos posibles, si no únicamente cuando sea m=n (esto último siempre se cumple con seguridad en el caso de 2 matrices cuadradas, no así necesariamente para el resto de los casos).

Ejemplo 6. Sean A y B 2 matrices de 2x3 (mxp) y 3x2 (pxm), respectivamente:

$$\begin{align} \mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{bmatrix} \; \; \mathbf{B} = \begin{bmatrix} b_{11} & b_{12} & \\ b_{21} & b_{22} & \\ b_{31} & b_{32} \end{bmatrix} \end{align}$$

Luego, el producto A.B=C será:

$$\begin{align} \mathbf{AB}= \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{bmatrix} \begin{bmatrix} b_{11} & b_{12} & \\ b_{21} & b_{22} & \\ b_{31} & b_{32} \end{bmatrix}= \begin{bmatrix} a_{11}b_{11} + a_{12}b_{21} + a_{13}b_{31} & a_{11}b_{12} + a_{12}b_{22} + a_{13}b_{32} \\ a_{21}b_{11} + a_{22}b_{21} + a_{23}b_{31} & a_{21}b_{12} + a_{22}b_{22} + a_{23}b_{32} \end{bmatrix}= \begin{bmatrix} c_{11} & c_{12} \\ c_{21} & c_{22} \end{bmatrix}=\mathbf{C} \end{align}$$

con la matriz C de dimensiones 2x2 (mxn).

7. Formulación Matricial de un SEL

La definición del producto punto y, de ahí, del producto entre 2 matrices permite formular un SEL utilizando matrices y notación matricial, de manera tal que se podrán utilizar las propiedades de estas entidades/objetos y de su Álgebra (las reglas de operación sobre estos) para evaluar la existencia y el tipo de soluciones posibles.

Un sistema de ecuaciones lineales de m ecuaciones y n incógnitas queda expresado mediante

$$\begin{align*} a_{11}x_1+a_{12}x_2+...+a_{1n}x_n&=b_1 \\ a_{21}x_1+a_{22}x_2+...+a_{1n}x_n&=b_2 \\ .& \\ .& \\ .& \\ a_{m1}x_1+a_{m2}x_2+...+a_{mn}x_n&=b_m \\ \end{align*}$$

Luego, si ordenáramos los mxn coeficientes según sus filas y columnas en una matriz, se obtendría la matriz de coeficientes A:

$$\mathbf{A} = \begin{bmatrix} a_{11} & a_{12} & . & . &. & a_{1j} & . & . & . & a_{1n} \\ a_{21} & a_{22} & . & . &. & a_{2j} & . & . & . & a_{2n} \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ a_{i1} & a_{i2} & . & . &. & a_{ij} & . & . & . & a_{in} \\ . & . & & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ a_{m1} & a_{n2} & . & . &. & a_{mj} & . & . & . & a_{mn} \\ \end{bmatrix}$$

obviamente, de dimensiones mxn.

Asimismo, podríamos ordenar las n incógnitas en un n-vector (nx1), obteniéndose el vector de incógnitas x:

$$\begin{align} \mathbf{x}=\begin{bmatrix} x_{1} \\ x_{2} \\ x_{3} \\ . \\ . \\ . \\ x_{j} \\ . \\ . \\ x_{n} \end{bmatrix} \end{align}$$

Asimismo, podríamos ordenar los m términos independientes en un m-vector (mx1), obteniéndose el vector de terminos independientes b:

$$\begin{align} \mathbf{b}=\begin{bmatrix} b_{1} \\ b_{2} \\ b_{3} \\ . \\ . \\ b_{i} \\ . \\ . \\ . \\ b_{m} \end{bmatrix} \end{align}$$

Si observamos, el producto Ax=b tendrá dimensiones mx1 (puesto que las dimensiones de A son mxn y de x son nx1). Así, podemos desarrollar el producto, extendiendo la notación matricial y utilizando las operaciones previamente definidas, de manera tal que observaremos:

$$\begin{align} \mathbf{A.x}= \begin{bmatrix} a_{11} & a_{12} & . & . &. & a_{1j} & . & . & . & a_{1n} \\ a_{21} & a_{22} & . & . &. & a_{2j} & . & . & . & a_{2n} \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ a_{i1} & a_{i2} & . & . &. & a_{ij} & . & . & . & a_{in} \\ . & . & & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ . & . & . & . &. & . & . & . & . & . \\ a_{m1} & a_{n2} & . & . &. & a_{mj} & . & . & . & a_{mn} \\ \end{bmatrix} \begin{bmatrix} x_{1} \\ x_{2} \\ x_{3} \\ . \\ . \\ . \\ x_{j} \\ . \\ . \\ x_{n} \end{bmatrix}= \begin{bmatrix} a_{11}x_1+a_{12}x_2+...+a_{1n}x_n \\ a_{21}x_1+a_{22}x_2+...+a_{1n}x_n \\ .& \\ .& \\ .& \\ a_{i1}x_1+a_{i2}x_2+...+a_{in}x_n \\ .& \\ .& \\ .& \\ a_{m1}x_1+a_{m2}x_2+...+a_{mn}x_n \end{bmatrix}= \begin{bmatrix} b_{1} \\ b_{2} \\ b_{3} \\ . \\ . \\ b_{i} \\ . \\ . \\ . \\ b_{m} \end{bmatrix}=\mathbf{b} \end{align}$$

Demostrándose que cualquier SEL con m incógnitas y n ecuaciones puede expresarse mediante el producto entre la matriz de coeficientes A (mxn) y el vector de incógnitas x (nx1), así obteniéndose el vector de términos independientes b (mx1). Luego, la formulación matricial de cualquier SEL (o descomposición en un producto de matrices), en notación simplificada y siguiendo las definiciones previamente adoptadas sobre A,x y b, queda dada mediante:

$$\begin{align} \mathbf{A.x}=\mathbf{b} \end{align}$$

Además, en el desarrollo precedente puede demostrase que b también puede formularse como una combinación lineal (ciertamente, cada ecuación lineal es una combinación lineal). En efecto,

$$\begin{align} \mathbf{b}=\begin{bmatrix} b_{1} \\ b_{2} \\ b_{3} \\ . \\ . \\ b_{i} \\ . \\ . \\ . \\ b_{m} \end{bmatrix}= \begin{bmatrix} a_{11}x_1+a_{12}x_2+...+a_{1n}x_n \\ a_{21}x_1+a_{22}x_2+...+a_{1n}x_n \\ .& \\ .& \\ .& \\ a_{i1}x_1+a_{i2}x_2+...+a_{in}x_n \\ .& \\ .& \\ .& \\ a_{m1}x_1+a_{m2}x_2+...+a_{mn}x_n \end{bmatrix}= \begin{bmatrix} a_{11} \\ a_{21} \\ .& \\ .& \\ .& \\ a_{i1} \\ .& \\ .& \\ .& \\ a_{m1} \end{bmatrix} x_1 + \begin{bmatrix} a_{12} \\ a_{22} \\ .& \\ .& \\ .& \\ a_{i2} \\ .& \\ .& \\ .& \\ a_{m2} \end{bmatrix} x_2 + ...+ \begin{bmatrix} a_{1j} \\ a_{2j} \\ .& \\ .& \\ .& \\ a_{ij} \\ .& \\ .& \\ .& \\ a_{mj} \end{bmatrix} x_j +...+ \begin{bmatrix} a_{1n} \\ a_{2n} \\ .& \\ .& \\ .& \\ a_{in} \\ .& \\ .& \\ .& \\ a_{mn} \end{bmatrix} x_n =\sum_{j=1}^{n} \mathbf{a_{j}}x_{j} \end{align}$$

esto es, mediante la sumatoria del producto escalar de cada uno de los aj n-vectores asociados a la j-ésima columna de A al respecto de cada una de las n incógnitas xj.

⚠️ **GitHub.com Fallback** ⚠️