Sistema de Riesgo Crediticio con RBM
Bienvenido a la documentación del Sistema de Riesgo Crediticio con Máquinas de Boltzmann Restringidas (RBM).
Este sistema integral permite el análisis y predicción de riesgo crediticio hipotecario para Colombia, utilizando técnicas avanzadas de Machine Learning y un sistema RAG educativo.
Características Principales
🎯 Objetivo del Proyecto
Crear un sistema integral que permita:
📊 Generar/cargar datos de solicitudes de crédito hipotecario
📈 Realizar análisis exploratorio avanzado
⚙️ Aplicar ingeniería de características automática
🧠 Entrenar modelos predictivos con RBM + clasificadores
🔮 Predecir riesgo crediticio en nuevos solicitantes
🎓 Aprender sobre Máquinas de Boltzmann mediante un asistente RAG
📊 Variables del Sistema
Variables Financieras del Crédito:
valor_inmueble: Valor comercial de la propiedad (COP)monto_credito: Monto solicitado del préstamo (COP)cuota_inicial: Porcentaje de cuota inicial (%)plazo_credito: Plazo del crédito en añostasa_interes: Tasa de interés anual (%)
Perfil Financiero del Solicitante:
puntaje_datacredito: Score crediticio (150-950)salario_mensual: Ingreso mensual (COP)egresos_mensuales: Gastos mensuales totales (COP)saldo_promedio_banco: Saldo promedio últimos 6 meses (COP)patrimonio_total: Patrimonio neto (COP)numero_propiedades: Cantidad de propiedades que poseenumero_demandas: Demandas legales por dinero
Variable Objetivo:
nivel_riesgo: Bajo / Medio / Alto
⚡ Máquinas de Boltzmann Restringidas
¿Qué es una RBM?
Una Máquina de Boltzmann Restringida es un modelo generativo no supervisado que:
Aprende representaciones latentes de los datos
Usa una arquitectura de dos capas (visible + oculta)
Se entrena con Contrastive Divergence (CD-k)
Extrae características útiles para modelos supervisados
Función de Energía:
Donde:
\(v_i\) son las unidades visibles
\(h_j\) son las unidades ocultas
\(W_{ij}\) son los pesos de conexión
\(a_i, b_j\) son los sesgos
🎓 Sistema RAG Educativo
Características:
🤖 Groq AI con Llama 3.3 70B parámetros
📚 Base de conocimiento con papers científicos
🔍 Búsqueda semántica con embeddings vectoriales
💬 Chat interactivo con citación de fuentes
📤 Carga automática de PDFs
Inicio Rápido
Instalación
# Clonar repositorio
git clone <tu-repositorio>
cd AppFIsica
# Crear ambiente virtual
python3 -m venv venv_fisica
source venv_fisica/bin/activate
# Instalar dependencias
pip install -r requirements.txt
Ejecución
# Activar ambiente virtual
source venv_fisica/bin/activate
# Ejecutar aplicación
streamlit run app.py
La aplicación se abrirá en: http://localhost:8501
Flujo de Trabajo
📊 Generar/Cargar Datos → Dataset de crédito hipotecario
🔍 Validar y Limpiar → Datos de alta calidad
📈 Análisis Exploratorio → Entender patrones
🔧 Ingeniería de Características → Variables derivadas
⚡ Entrenar RBM → Extraer características latentes
🤖 Modelos Supervisados → Clasificadores de riesgo
🔮 Predicción → Evaluar nuevos solicitantes
🎓 Aprender → Sistema RAG educativo