Metodología de Recolección de Datos
Resumen
Este documento describe cómo se recopilan, verifican y actualizan los datos del ecosistema de financiamiento verde colombiano que alimentan la plataforma Ruta Verde. Es el documento de referencia para auditores, donantes y socios que deseen verificar cualquier dato del sistema.
Fuentes Primarias
| Institución | Tipo Fuente | URL | Última Verificación |
|---|---|---|---|
| Bancóldex | Página web + comunicados de prensa | bancoldex.com | Junio 2026 |
| Findeter | Página web + informes anuales | findeter.gov.co | Junio 2026 |
| Bancolombia | Informe Integrado 2024 + web | grupobancolombia.com/informeintegrado/2024 | Junio 2026 |
| Davivienda | Informe de Sostenibilidad 2024 | davivienda.com/sostenibilidad | Junio 2026 |
| BBVA Colombia | Informe No-Financiero 2024 | bbva.com.co/responsabilidad-corporativa | Junio 2026 |
| Banco de Bogotá | Comunicados + web sostenibilidad | bancodebogota.com/sostenibilidad | Junio 2026 |
| Banco Agrario | Informe de Gestión y Sostenibilidad 2024 | bancoagrario.gov.co | Junio 2026 |
| Bancamía | Página web productos | bancamia.com.co | Junio 2026 |
| Banco W | Página web + comunicados bono social | bancow.com.co | Junio 2026 |
| BID/IDB | Portal de proyectos BID | iadb.org/en/project/CO-L1289 | Junio 2026 |
| IFC | Comunicados de prensa | ifc.org | Junio 2026 |
| Banco de la República | IBR rates vía Grupo Aval/BanRep | banrep.gov.co | 2026-06-23 |
Método de Extracción
Importación inicial (xlsx)
El dataset base de 51 productos fue construido manualmente a partir de páginas web bancarias, informes de sostenibilidad 2024 y comunicados de prensa. Cada campo fue verificado contra la fuente primaria antes de la importación.
Pipeline automatizado semanal
El pipeline se ejecuta cada domingo a las 23:00 via systemd timer en el VPS CTH. Pasos:
- Scraper HTTP visita páginas de productos de 6 bancos (Bancóldex, Findeter, Bancolombia, Davivienda, BBVA, Banco de Bogotá)
- Extrae señales de cambio (variaciones en tasa IBR, disponibilidad de línea)
- Compara contra los valores actuales en la DB MariaDB
- Detecta diffs → genera lista de cambios pendientes de aprobación
- Envía digest semanal por Telegram al equipo CTH
- Genera los tres JSON tier (admin, partners, investors) para el dashboard
Normalización de tasas
Las tasas se normalizan a puntos base (BPS) sobre IBR overnight. IBR como referencia: 10.51% (2026-06-23, fuente: Banco de Bogotá Internacional / Banco de la República). Las tasas no comparables en BPS (concesional, leasing, garantía) se almacenan como NULL en rate_normalized_spread.
Cadena de Trazabilidad
- Dashboard muestra el dato → e.g. "BCO-01 tasa: IBR + margen, descuento sostenible"
- DB almacena la fuente → tabla
data_sources: URL, fecha de acceso, método de extracción - Wiki documenta el método → esta página + Página 4 (Registro de Fuentes)
Frecuencia de Verificación
- Semanal: Pipeline automatizado (scrapers)
- Trimestral: Spot-check de 10 productos contra páginas web bancarias
- Anual: Refresh competitivo completo
No hay comentarios para mostrar
No hay comentarios para mostrar