La mejor forma de extraer normativa legal chilena.
Herramienta diseñada para descargar, procesar y almacenar de forma programática las normas legales de la Biblioteca del Congreso Nacional de Chile. Pensada como la capa de extracción de un pipeline ELT para análisis legal.
Características
¿Qué hace BCNE?
Herramientas y funcionalidades diseñadas para facilitar el acceso programático a la legislación chilena.
Extracción Automatizada
Descarga resiliente de normas desde los servicios web de la BCN con reintentos automáticos, rate-limiting configurable y sistema de caché.
Almacenamiento Estructurado
Base de datos PostgreSQL con esquema normalizado que relaciona normas, instituciones y tipos. Respaldo automático de XMLs originales.
Búsqueda Full-Text
Índices GIN sobre contenido de normas utilizando el motor FTS de PostgreSQL configurado para el idioma español.
API REST
Endpoints programáticos con FastAPI para consultar normas, instituciones y búsquedas avanzadas. Documentación OpenAPI generada automáticamente.
Detección de Cambios
Cada norma se verifica mediante hash MD5 del XML original, evitando sincronizaciones innecesarias y garantizando consistencia.
Despliegue con Docker
Configuración lista con docker-compose para levantar PostgreSQL y el entorno de forma rápida y replicable en cualquier sistema.
Casos de uso
¿Para quién está pensado?
Desde investigación académica hasta aplicaciones empresariales de compliance y data science.
Análisis Legal
Investigadores y académicos que necesitan analizar un corpus legislativo específico de un sector o institución para estudios comparativos o de tendencias normativas.
Compliance Empresarial
Empresas que deben monitorear y mantener al día las normativas aplicables a su industria. La sincronización batch permite detectar normas nuevas o modificadas.
Transparencia Ciudadana
Ciudadanos y organizaciones civiles que buscan acceder a información legal estructurada y programática, reduciendo la barrera de acceso a la legislación nacional.
Data Science & NLP
Científicos de datos que necesitan un corpus legal limpio y estructurado para aplicar técnicas de procesamiento de lenguaje natural o aprendizaje automático.