# Librería Numpy

https://numpy.org/devdocs/index.html

In [None]:
#Forma más común de import numpy, utilizando el alias np
import numpy as np

* La librería ```numpy``` nos permite trabajar con arreglos matriciales de datos.

* El objeto principal de esta librería son arreglos **homogéneos** multidimensionales (puede pensarlo como un arreglo que contiene una o más tablas).

* La dimensiones de un arreglo se llaman **ejes** (axis).

* El número de ejes se llama el **rango** (rank).

Para crear un arreglo, se utiliza la función `array`

```python
import numpy as np
arreglo = np.array([1,2,3])

#INCORRECTO
#Se tienen que poner los elementos
#adentro de una lista (o tupla)
arreglon = np.array(1,2,3)
```

In [None]:
#Renglón de 3 elementos
arreglo = np.array([1,2,3])
print(arreglo)
print(type(arreglo))

In [None]:
#Matriz con 2 renglones y 3 columnas
arr1 = np.array( [ [1, 2, 3], [4, 5, 1] ] )
print(arr1)

In [None]:
#Los arreglos son homogéneos
homogeneo1 = np.array([1,2, '3'])
print(homogeneo1)
#Unicode string de 21 caracteres
print(homogeneo1.dtype)

In [None]:
homogeneo2 = np.array([1,2, {'c':3}])
print(homogeneo2)
print(homogeneo2.dtype)

## Aplicando funciones sobre los ejes (renglones o columnas)

Los `ndarrays` tienen métodos que pueden ser aplicados a cada uno de los ejes

In [None]:
#Suma los elementos en dirección de los renglones
#Fija columna y suma sobre cada renglón
print(arr1.sum(axis = 0))

In [None]:
#Suma los elementos en dirección de las columnas
#Fija renglón y suma sobre cada columna
print(arr1.sum(axis = 1))

In [None]:
print(arr1)
print('--'*20)
print(arr1.max(axis = 0))
print('--'*20)
print(arr1.max(axis = 1))

In [None]:
#Arreglo de tres dimensiones
arr3d = np.array([ [ [1, 2, 3], [4, 5, 6] ],\
                  [ [6, 7, 8], [9, 10, 11] ]  ])

#shape es un atributo que nos dice
#las dimensiones de un arreglo
#En este caso (2, 2, 3)
#Dos matrices de 2 x 3 cada una
print(arr3d.shape)
print('--' * 20)
#Primera matriz
print(arr3d[0])
#Segunda matriz
print('--' * 20)
print(arr3d[1])
print('--' * 20)

#El atributo ndim nos dice el número
#de dimensiones (ejes) que contiene 
#un arreglo
print('El arreglo tiene', arr3d.ndim, 'dimensiones')
print('--' * 20)

#El atributo size nos dice el número
#de elementos de un arreglo
#Esto es igual al producto
#de los elementos de shape
print('El arreglo tiene', arr3d.size, 'elementos')

## Vectorización de operaciones

Las operaciones en `numpy` se aplican elemento a elemento (vectorizan). Esto nos permite evitar el uso de *loops*.

In [None]:
#Multiplicamos cada entrada por 2
print('Arreglo')
print(arr1)
print('--' * 20)
print(arr1 * 2)

#Sumamos entrada por entrada un 3
print('--' * 20)
print(arr1 + 3)

#Comparamos entrada por entrada
#una condición lógica
print('--' * 20)
print(arr1 <= 3)

Las operaciones entre arreglos también se aplican
entrada por entrada

In [None]:
arr2 = np.array([[4,5,6], [7, 8, 9]])
print('Arreglo 1')
print(arr1)
print('--' * 20)
print('Arreglo 2')
print(arr2)

#Suma entrada con entrada
print('--' * 20)
print(arr1 + arr2)

#Divide entrada con entrada
print('--' * 20)
print(arr1 / arr2)

#Comparación lógica entrada
#por entrada
print('--' * 20)
print(arr1 <= arr2)

#Multiplicación entrada
#por entrada
#NO ES PRODUCTO DE MATRICES
print('--' * 20)
print(arr1 * arr2)

## Funciones matemáticas

```numpy``` tiene un conjunto de funciones matemáticas que pueden aplicarse a un a`ndarray` (entrada por entrada). 

Estas funciones son llamadas **funciones universales** (`ufunc`)

In [None]:
print(type(np.exp))
#Aplicamos la función a un ndarray
print(arr1)
print('--' * 20)
print(np.exp(arr1))

**Algunas funciones universales**

```python
np.sin
np.cos
np.exp
np.log #Logaritmo natural
np.log10 #Logaritmo base 10
np.log2 #Logaritmo base 2
```

**NOTA-1:**

Las funciones de la librería ```math``` no funcionan ndarrays.

**NOTA-2:** 

Las funciones universales no tienen el parámetro axis.

In [None]:
import math
math.sin(arr1)

In [None]:
#max si acepta el parámetro axis
print(type(np.max))

#exp no acepta axis
print(type(np.exp))

#ERROR
np.exp(arr1, axis = 0)

## np.arange, np.linspace
Podemos crear rangos de números $[a, b)$ usando la funcion `arange` (similar a `range` en Python)

In [None]:
#Similar a range(10)
np.arange(10)

In [None]:
#Similar a range(2, 11, 2)
np.arange(2, 11, 2)

In [None]:
#A diferencia de range np.arange
#nos permite tomar pasos fraccionarios
np.arange(1, 5, 0.5)

Usamos la función `linspace` cuando deseamos un arreglo de $n$ elementos entre $a$ y $b$ (inclusivo); $a < b$

In [None]:
help(np.linspace)

In [None]:
a, b = 2, 10
x = np.linspace(a, b, 20)
print(x)

## Ejercicio

Crea un numpy array con 100 elementos $\{x_i\}_{i=0}^{99}$ donde
$$
    x_i = i (i + 100) \, \text{ para }  i \in \{0, \ldots, 99\}
$$

e.g., $x_{99} = 19701$; $x_{10} = 1100$ 

## Reshape y Ravel

Podemos cambiar la forma (`shape`) de un ndarray utilizando las funciones reshape y ravel.

* Reshape crea un nuevo arreglo con la forma deseada.

* Ravel convierte el arreglo en un arreglo de dimensión 1 (aplana el arreglo para crear un renglón).

In [None]:
print(arr1)
print(arr1.shape)
print('--' * 20)

#reshape NO es IN-PLACE, es
#necesario guardar el resultado
#en otra variable (o sobreescribirla)
arr1_mod = arr1.reshape((3, 2))
print(arr1_mod)
print(arr1_mod.shape)

#un renglón lo convertimos en una matriz
renglon = np.arange(12)
matriz = renglon.reshape((4, 3))
print('--' * 20)
print(renglon)
print('--' * 20)
print(matriz)

In [None]:
#Reshape también puede utilizarse de la siguiente manera
arr = np.arange(12)
print(arr)
print('--'*20)
arr = np.reshape(arr, (4, 3))
print(arr)

In [None]:
#Es posible que una dimensión se determine
#de manera automática, para esto se utiliza un -1
arr = np.arange(12)
print(arr.shape)
print('--' * 20)
arr_mod = arr.reshape((3, -1))
print(arr_mod)

Si `S = arreglo.size` y hacemos

```python
arreglo_mod = arreglo.reshape((m,n,k...))
```

es necesario que
$$
m \times n \times k \times \ldots = S
$$

In [None]:
#ravel 'aplana' un arreglo
print(arr3d)
print('--' * 20)
aplanado = arr3d.ravel()
print(aplanado)
print(aplanado.shape)

## Slicing

Existen distintas maneras de acceder a los elementos de cada dimensión de un array

In [None]:
arr = np.arange(25).reshape(5, 5)
print(arr)
fila, columna = 1, 2
arr[fila, columna]

In [None]:
filas, columnas = [-2, -1], [0, 3]
arr[filas, columnas]

Podemos seleccionar múltiples filas usando ```:```.

Además es posible modificar las entradas a las que accedemos (los arrays son mutables)

In [None]:
print(arr)
print('--' * 20)
arr[[0, -1],:]

In [None]:
#Modificamos las entradas seleccionadas
arr[[0, -1], :] = 0
print(arr)

In [None]:
#No es necesario utilizar :
#(Aunque al usarlos se facilita la lectura)
arr[[0, -1]] # equivalente a arr[[0, -1], :]

In [None]:
# podemos asignar varios valores de la misma
# dimension a la que se le hizo la selección
x = np.random.randint(-100, -1, size=(3, 5))
print('Arreglo arr original')
print(arr)
print('-' * 20)
print('Valores que se insertan')
print(x)
print('-' * 20)
arr[[0, -1, 3], :] = x
print('Arreglo arr modificado')
print(arr)

In [None]:
# Al igual que una lista en Python, podemos
# revertir el orden de un numpy array con índices
arr[1, ::-1]

In [None]:
# Podemos encontrar los índices dentro de un 
# numpy array usando np.where
a4 = np.array([-1, 0,  1, -2, 1, 0, -4])
print(a4 [np.where(a4 > 0)] )

#Equivalente
print(a4[ a4 > 0 ])

In [None]:
#Entendiendo np.where
a5 = np.array([
    [-1, 0,   1, -2,  1,  0, -4],
    [1,  1,  -1,  2,  2, -3,  4],
])
print(a5)
cumplen_condicion = np.where(a5 > 0)
print('--' * 20)
print(cumplen_condicion)
#(array([0, 0, 1, 1, 1, 1, 1]), array([2, 4, 0, 1, 3, 4, 6]))
       #INDICE DE LA LISTA      ÍNDICE ADENTRO DE LA LISTA
#help(np.where)    

In [None]:
a5[cumplen_condicion]

## Broadcasting

https://numpy.org/doc/stable/user/basics.broadcasting.html

**Broadcasting** (difusión) es la manera en que numpy manipula *arrays* con diferentes dimensiones durante operaciones aritméticas.
Para dos arreglos $A$ y $B$, es posible hacer broadcasting cuando 

1. Tienen la misma dimensión o
2. Una dimensión es igual a 1 y coinciden en las demás.

In [None]:
A = np.arange(25).reshape(5, 5)
B = np.arange(5).reshape(1, 5)

print(A)
print('--' * 20)
print(B)

In [None]:
#Multiplica cada renglón de A
#elemento por elemento con el rengón B
A * B

In [None]:
#Suma cada renglón de A
#elemento por elemento con el renglón B
A + B

## Iterando un arreglo en un loop for

Cuando iteramos sobre un `ndarray` utilizando un loop *for* se itera sobre los elementos que corresponden a `axis = 0`.

Así, en el caso de matrices, se estaría iterando sobre los renglones de esta.

In [None]:
matriz = np.array([[1,2,3], [4,5,6]])
print(matriz)
print('--' * 20)
for renglon in matriz:
    #Equivalente a
    #matriz[i,:]
    print(renglon)
    print('--' * 20)

print(arr3d)    
print('--' * 20)
for matriz in arr3d:
    #Equivalente a 
    #arr3d[i, :, :]
    print(matriz)
    print('--' * 20)

## Un poco de álgebra lineal

https://numpy.org/doc/stable/reference/routines.linalg.html

In [None]:
#Si un arreglo representa una matriz
#es posible transponerla utilizando
#el método transpose
matriz_A = np.array([ [2, 1, 0], [1, 3, 5] ])
A_transp = matriz_A.transpose()
print(matriz_A)
print('--' * 20)
print(A_transp)

In [None]:
#Para obtener la diagonal de una matriz
#se utiliza la función diagonal

#matriz de 3 x 3
matriz = np.array([[1,2,3], [4,5,6], [7,8,9]])

#se extrae la diagonal
diag = matriz.diagonal()

print(matriz)
print('--' * 20)
print(diag)
print('--' * 20)

#La matriz no tiene que ser cuadrada
matriz = np.array([[1,2,3], [4,5,6]])
diag = matriz.diagonal()


print(matriz)
print('--' * 20)
print(diag)

In [None]:
#Matriz de ceros
mat_ceros = np.zeros(shape=(3,3))
print(mat_ceros)
print('--' * 20)

#Matriz de False
mat_ceros_false = np.zeros(shape = (3,3), dtype = bool)
print(mat_ceros_false)

In [None]:
#matriz indentidad
identidad = np.identity(5)
print(identidad)
print('--' * 20)

#similiar pero no exactamente igual a identity
eye_cuadrada = np.eye(5)
print(eye_cuadrada)
print('--' * 20)
eye_rectangular = np.eye(5,6)
print(eye_rectangular)

In [None]:
#Para realizar el producto punto de vectores
#utilizamos la función dot
vector1 = np.array([1,2,3,4])
vector2 = np.array([1,1,1,1])
prod_punto = np.dot(vector1, vector2)
print(prod_punto)

In [None]:
#Para multiplicar matrices podemos utilizar:
#>> función dot (no recomendado)
#>> función matmul
#>> operador @

matriz_A = np.array([ [1,2,3], [4,5,6], [7,8,9] ])
matriz_B = np.array([[1,2,3,4], [5,6,7,8],\
                     [9, 10, 11, 12] ] )

prod_dot = np.dot(matriz_A, matriz_B)
prod_matmul = np.matmul(matriz_A, matriz_B)
prod_arrob = matriz_A @ matriz_B

print(prod_dot)
print('--' * 20)
print(prod_matmul)
print('--' * 20)
print(prod_arrob)

In [None]:
#Podemos resolver sistemas de ecuaciones lineales
#utilizando la función solve del módulo linalg
help(np.linalg.solve)

In [None]:
#Para encontrar la matriz inversa se utiliza la función
#inv del módulo linalg

A = np.array([ [975, 875], [740, 875] ])
A_inv = np.linalg.inv(A)

#Validamos
identidad = np.identity(A.shape[0])
print(A @ A_inv)
print('--' * 20)
print(A_inv @ A)
print('--' * 20)
print(np.allclose(A @ A_inv, identidad))
print(np.allclose(A_inv @ A, identidad))

# Ejercicio
Crea un numpy array en $\mathbb{R}^{10\times 10}$ tal que

$$
x_{i,j} = 
\begin{cases}
    2(i + 1) & \forall \ i = j \\
    0 & \forall \ i \neq j
\end{cases}
$$

Considera $i, j \in \{0, \ldots, 9\}$

```python
help(np.nonzero)
```

# Ejercicio

Resuelva el siguiente sistema de ecuaciones lineales

$$
\begin{matrix}
 3x & + & y & = & 9 \\
x & + & 2y & = & 8
\end{matrix}
$$

# Ejercicio

Implemente el producto de matrices sin utilizar numpy.
Pruebe su código con los siguientes datos

```python
A = [ [1,2,3], [4,5,6], [7,8,9] ]
B = [ [1,2], [4,5], [7,8] ]
```

## Ejercicio

Programe una función que calcule la distancia euclidiana entre dos vectores

$$
d(\mathbf{x}, \mathbf{y}) = \sqrt{ \sum_{i=1}^{n} \left(x_i - y_i \right)^2 }
$$

Pruebe su función con los vectores

$\mathbf{x} = (1,2,3)$ y $\mathbf{y} = (3, 2, 1)$

## Aplicando una función sobre un eje determinado

Numpy nos permite aplicar una función a un eje en particular usando la función `np.apply_along_axis(func1d, axis, arr, *args, **kwargs)`; donde `func1d` es una función. $f:\mathbb{R}^n \to \mathbb{R}^m$, `axis` es el eje sobre el que se trabajará y `arr` el arreglo con los datos, `*args* y *kwargs*` son argumentos adicionales de `func1d`.

In [None]:
from numpy.random import randint, seed
seed(1643)
a3 = randint(-10, 10, size=(5,4))
print(a3)

In [None]:
def mi_funcion(x):
    print(type(x))
    print(x)

In [None]:
resultado = np.apply_along_axis(mi_funcion, axis=0, arr=a3)

In [None]:
def suma_numero(a, *args):
    numero = args[0]
    print('a el ndarray', a, ' se le sumará', numero)
    return a + numero

resultado = np.apply_along_axis(suma_numero, 0, a3, 5)
print('--' * 20)
print(resultado)

In [None]:
def mi_funcion2(x):
    return np.sin(x) + np.cos(x)

resultado = np.apply_along_axis(mi_funcion2, axis=1, arr=a3)
print(resultado)

In [None]:
# Ordenando cada renglón de una fila
print(np.apply_along_axis(sorted, 1, a3))

**Nota**

Al usar la función `np.apply_along_axis`, numpy aplica implicitamente un for loop en python sobre el eje que decidamos. Usar `np.apply_along_axis` **no** es la manera más eficiente de realizar este tipo de operaciones. Siempre que exista una operación equivalente de python en numpy, es recomendable usar la función dentro de numpy.

Por ejemplo, el equivalente de `sorted` en python es `np.sort` en numpy

In [None]:
#sort es IN-PLACE
print(a3)
print('--' * 10)
a3.sort(axis = 0)
print(a3)
print('--' * 10)
a3.sort(axis = 1)
print(a3)