In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Ejercicio 

Suponga que se tiran dos dados de $3$ caras. Sea $X$ la cara que muestra el primer dado y sea $Y$ la suma de los dos dados. Utilizando simulación encuentre $f_{XY}$ y a partir de esta densidad, encuentre las densidades marginales  $f_{X}$ y $f_{Y}$.

In [None]:
#Número de simulaciones
n_sim = 100_000

#Posibles caras de un dado
caras = [1,2,3]

#posibles sumas de dos dados
sumas = [2, 3, 4, 5, 6]

#Tira los dados
dado1 = np.random.choice(caras, size = n_sim)
dado2 = np.random.choice(caras, size = n_sim)

#crea las variables X y Y
#cada renglón de la matriz
#representa el resultado de un experimento
mat_sim = np.array([dado1, dado1 + dado2]).transpose()

In [None]:
def obten_conjunta(mat_sim, caras, sumas):
    '''
    Función para estimar la distribución 
    conjunta
    
    ENTRADA
    mat_sim: ndarray que reprensenta las simulaciones
    
    caras: lista con las posibles caras del dado
    
    sumas: lista con las posibles sumas de dos dados
    
    SALIDA
    un diccionario que contiene las probabilidades
    dic[x][y] = Prob(X = x, Y = y) 
    '''
    
    #obtiene el número de simulaciones
    n_sim = mat_sim.shape[0]
    
    #para almacenar la tabla de probabilidades
    tabla_prob = {}
    
    for cara in caras:
        tabla_prob[cara] = {}
        
        for suma in sumas:
            #Cuenta casos de éxito
            #(X == cara, Y == suma)
            #logical_and regresa un array de True y False
            conteo = np.logical_and(mat_sim[:,0] == cara, \
                                   mat_sim[:,1] == suma).sum()
            
            #Estima probabilidad
            tabla_prob[cara][suma] = conteo / n_sim
    return tabla_prob

In [None]:
f_conjunta = obten_conjunta(mat_sim, caras, sumas)
print(f_conjunta)

In [None]:
def obten_marginal_x(f_conjunta):
    '''
    Obtiene la densidad marginal de x
    
    ENTRADA
    f_conjunta: diccionario creado con la función
    obten_conjunta
    
    SALIDA
    diccionario tal que dic[x] = Prob(X = x)
    '''
    
    #para almacenar las probabilidades
    #marginales
    f_x = {}
    
    #recuerde que en un diccionario
    #el for itera sobre las llaves
    for val in f_conjunta:
        
        #Suma sobre las Y's
        #Observe el casting a list
        f_x[val] = np.sum(list(f_conjunta[val].values()))
        
    return f_x    

In [None]:
marginal_x = obten_marginal_x(f_conjunta)
print(marginal_x)

In [None]:
def obten_marginal_y(f_conjunta, sumas):
    '''
    Función para obtener la densidad marginal de Y
    
    ENTRADA
    f_conjunta: diccionario creado con la función
    obten_conjunta
    
    sumas: lista con los posibles valores de Y
    
    SALIDA
    diccionario tal que dic[y] = Prob(Y = y)
    '''
    
    #para almacenar las probabilidades
    f_y = {}
    
    #fija valor de Y
    for suma in sumas:
        
        prob_acum = 0
        #Acumula las probabilidades
        #sobre los valores X
        for key in f_conjunta:
            prob_acum = prob_acum + f_conjunta[key][suma]
        
        f_y[suma] = prob_acum
            
    return f_y    

In [None]:
marginal_y = obten_marginal_y(f_conjunta, sumas)
print(marginal_y)

# Ejercicio

Si $f(x,y) = 6(1 - y)$ para $0 < x < y < 1$, utilizando simulación compruebe que

* $E\left[X | Y = 1 /2 \right] = 0.25$

* $Var\left[X | Y = 1 /2 \right] = 0.021$



In [None]:
def distribucion_inversa(u, y = 0.5):
    '''
    Función inversa de la función F_{x|y} 
    
    ENTRADA
    u: Float en (0, 1) o np.array con números en (0, 1)
    
    y: Float en (0, 1)
    
    SALIDA
    float o np.array de floats
    '''
    return y * u

def simula_aleatorio(y = 0.5, n_sim = int(1e4)):
    '''
    Función para simular un números aleatorios de la densidad 
    f_{x|y}
    
    ENTRADA
    n_sim: Entero positivo, número de simulaciones
    
    y: Float en (0, 1)
    
    SALIDA
    float o np.array de floats
    '''
    
    #Genera uniforme (0,1)
    u = np.random.uniform(low = 0, high = 1, size = n_sim)
    
    return distribucion_inversa(u,y)
    

In [None]:
aleatorios = simula_aleatorio(y = 0.5, n_sim = int(1e5))
media = np.mean(aleatorios)
segundo_momento = np.mean(aleatorios**2)
varianza = segundo_momento - media**2
print("La media es", round(media, 3))
print("La varianza es", round(varianza, 3))

# Covarianzas y correlaciones

In [None]:
#help(np.cov)
#help(np.corrcoef)
n_muestras = int(1e5)

np.random.seed(1234)
#Variables normales media cero desviación estándar 1
x_1 = np.random.normal(size = n_muestras)

#coeficiente de correlación
rho = 0.7

#x_2 tiene correlación rho con x_1 
#y tiene distribución normal media 0 desviación estándar 2
sig_2 = 2
z = np.random.normal(size = n_muestras)
x_2 = sig_2 * (rho * x_1 + np.sqrt(1 - rho**2) * z)

#matriz de datos
#en este caso cada cada renglón es una variable
#y cada columna es una observación
#Estructura default del parámetro rowvar
mat_datos = np.array([x_1, x_2])
print(mat_datos.shape)

#matriz de covarianzas
mat_cov = np.cov(mat_datos)


#matriz de correlaciones
mat_cor = np.corrcoef(mat_datos)

print('La matriz de covarianzas es')
print(mat_cov)
print('-' * 50)
print('La matriz de correlaciones es')
print(mat_cor)

plt.plot(x_1, x_2, '.')
plt.xlabel('$X_1$')
plt.ylabel('$X_2$')
plt.show()