# Cheat Sheet

https://web.cs.elte.hu/~mesti/valszam/kepletek

# Ejercicio

Si $X_1,\ldots,X_n$ son variables independientes con distribución $N(\mu, \sigma^2)$, es posible demostrar que los estimadores máximos verosímiles para $\mu$ y $\sigma^2$ son

$$
\widehat{\mu(\mathbf{X})} = \bar{X}
$$
$$
\widehat{ \sigma^2 (\mathbf{X}) } = \dfrac{1}{n} \sum_{i=1}^{n} (X_i - \bar{X})^2
$$

Compruebe lo anterior utilizando `scipy.optimize` junto con una muestra de 100 variables $N(\mu = 1, \sigma = 1.5)$

Utilice el método de optimización 'L-BFGS-B'.


In [None]:
import numpy as np
from scipy.optimize import minimize
from scipy.optimize import Bounds
from scipy.stats import norm
from scipy.stats import poisson

In [None]:
def log_like_normal(params, *args):
    '''
    Función para calcular el logaritmo (natural) de una función
    de densidad normal
    
    ENTRADA
    params: Numpy array con dimensión 1 y shape(n,) en donde n es el número
    de variables que se quieren optimizar
    
    *args: Tupla de parámetros fijos necesarios para definir completamente
    la función
    
    SALIDA
    Valor de logaritmo (natural) de una función de densidad normal
    '''
    #Valores de cada variable en X_i
    datos = args[0] 
    mu = params[0]
    sig = params[1]
    
    return -np.sum( norm.logpdf(x = datos, loc = mu, scale = sig) )

In [None]:
#Genera la una muestra
np.random.seed(54321)
x = norm.rvs(loc = 1, scale = 1.5, size = 100)

#Solución inicial
x0 = np.array([0,1])

#Cotas
#mu puede tomar cualquier valor en [-np.inf, np.inf]
#sigma cualquier valor en [0, np.inf]
cotas = Bounds(lb = [-np.inf, 0], ub = [np.inf, np.inf])

#Obtiene la solución
solucion = minimize(log_like_normal,x0 = x0, bounds=cotas, method='L-BFGS-B',args=(x))
print(solucion)
print(type(solucion))

In [None]:
print("La solución analítica para mu es ", np.round(x.mean(), 6))
print("La solución aproximada para mu es ", np.round(solucion.x[0], 6))
print("La solución analítica para sigma^2 es ", np.round(x.var(ddof = 0), 6))
print("La solución aproximada para sigma^2 es ", np.round(solucion.x[1]**2, 6))
#Aplicamos el teorema de invarianza de los MLE para encontrar un estimado
#de la desviación estándar
print("La solución analítica para sigma es ", np.round(x.std(ddof = 0), 6))
print("La solución aproximada para sigma es ", np.round(solucion.x[1], 6))

# Ejercicio

Compruebe que el estimador máximo verosímil de una distribución ```Poisson``` con $\lambda = 2.5$, es el promedio de las observaciones.

Utilice una muestra de tamaño $100$.

Utilice el método de optimización 'L-BFGS-B'.

In [None]:
def log_lik_poisson(params, *args):
    datos = args[0]
    lam = params[0]
    
    return -np.sum(poisson.logpmf(k = datos, mu = lam))

In [None]:
np.random.seed(54321)
simulados = poisson.rvs(size = 100, mu = 2.5)

#Punto inicial
x0 = np.array([5])
cotas = Bounds(lb = [0], ub = [np.inf])

solucion = minimize(log_lik_poisson, x0 = x0, args = (simulados),
                   method = 'L-BFGS-B', bounds = cotas)

print(solucion)
print(simulados.mean())