KRON
La inteligencia artificial que construimos desde cero.
Ningún API externo. Ningún proveedor de terceros. Cada modelo entrenado con nuestros datos, en nuestro hardware, bajo nuestro control total.
~53M
Parámetros totales
3
Modelos propios
0
APIs externas
100%
PyTorch propio
Por qué
¿Por qué construir la IA desde cero?
Usar la API de OpenAI es fácil. Construir la tuya propia es difícil. Elegimos lo difícil porque las razones importan.
Control total
Si dependes de OpenAI o cualquier otro proveedor, ellos controlan tus precios, tu disponibilidad y tus datos. Con KRON, controlamos cada capa del stack.
Sin coste por token
Las APIs externas cobran por cada llamada. KRON corre en nuestro servidor: coste fijo, sin sorpresas, sin límites artificiales de uso.
Diseñada para escalar
KRON no es un modelo monolítico. Es un sistema modular con pipeline de plugins: cada producto nuevo de DynamisAI puede conectarse sin reescribir nada.
Propiedad intelectual
Cada peso entrenado es nuestro. No cedemos datos a terceros para mejorar sus modelos. Lo que entrenamos con nuestros datos, nos pertenece.
"KRON no es solo la IA de MeetingScribe. Es la base sobre la que construiremos todos los productos de DynamisAI. Un cerebro compartido que aprende y mejora con cada producto que desarrollamos."
— DynamisAI
Arquitectura
Tres modelos, un pipeline
KRON no es un modelo único. Es un sistema de tres modelos especializados que trabajan en cadena: audio entra, resumen e tareas salen.
ConformerASR
~30M parámetrosReconocimiento de voz
Arquitectura Conformer (CNN + Transformer) optimizada para transcripción de audio en reuniones. Entrena sobre datos de audio en español e inglés con decodificación CTC Beam Search.
- ›Encoder Conformer multicapa
- ›CTC Head para decodificación
- ›Log-Mel features (80 bins)
- ›SpecAugment para robustez
- ›VAD integrado
MeetingSummarizer
~15M parámetrosResumen de reuniones
Modelo Seq2Seq Transformer entrenado específicamente para condensar transcripciones de reuniones en resúmenes ejecutivos concisos con los puntos clave.
- ›Arquitectura Encoder-Decoder
- ›Tokenizer BPE (vocab 8.000)
- ›Fine-tuning en datos de reuniones
- ›Multiidioma (ES + EN)
TaskExtractor
~8M parámetrosExtracción de tareas
Modelo de clasificación y extracción de entidades entrenado para detectar compromisos, tareas asignadas y decisiones dentro del texto de una transcripción.
- ›Clasificación de secuencias
- ›NER para detectar asignados
- ›Extracción de fechas/plazos
- ›Confianza por tarea
Stack completo
Estado actual
Fase 0 completada
Los fundamentos están construidos. La arquitectura completa está en código. El siguiente paso es el entrenamiento de los modelos.
Completado — Fase 0
- ✓Arquitectura completa definida y estructurada
- ✓ConformerASR — código del modelo completo (encoder, CTC head)
- ✓MeetingSummarizer — arquitectura Seq2Seq implementada
- ✓TaskExtractor — modelo de clasificación implementado
- ✓Audio pipeline: preprocesado, Log-Mel features, VAD, SpecAugment
- ✓KronTokenizer BPE (sentencepiece, vocab 8.000)
- ✓FastAPI REST con todos los routers (/asr, /nlp, /pipeline, /health)
- ✓Sistema de plugins con auto-discovery
- ✓MeetingPipeline: ASR → summarize → extract tasks
- ✓JobManager — jobs asíncronos con asyncio
- ✓Almacenamiento SQLite/PostgreSQL con SQLAlchemy async
- ✓Scripts de entrenamiento listos para los 3 modelos
Próximas fases
- ○Entrenar tokenizer BPE con corpus en español/inglés
- ○Descargar y preparar datasets de audio (LibriSpeech, Common Voice ES)
- ○Entrenamiento del modelo ASR (~30M params) en GPU
- ○Validación y evaluación WER del ASR
- ○Entrenamiento del MeetingSummarizer en corpus de reuniones
- ○Entrenamiento del TaskExtractor
- ○Integración live con MeetingScribe desktop
- ○Pruebas end-to-end del pipeline completo
Progreso global del proyecto
~25%Roadmap
El camino que estamos recorriendo
De la arquitectura al modelo entrenado, hasta el producto en manos de los usuarios. Aquí está el plan completo, fase por fase.
Fase 0: Fundamentos
Diseño completo de la arquitectura, implementación de los tres modelos en PyTorch, pipeline de audio, tokenizer BPE, API REST con FastAPI y sistema de plugins.
- Arquitectura ConformerASR, Summarizer, TaskExtractor
- FastAPI + routers completos
- Plugin system con auto-discovery
- Training scripts listos
Fase 1: Tokenizer & Datos
Entrenamiento del tokenizer BPE con corpus en español e inglés, descarga y preparación de los datasets de audio (CommonVoice ES, LibriSpeech EN) y corpus de texto de reuniones.
- Entrenamiento KronTokenizer (vocab 8k)
- Descarga CommonVoice ES + LibriSpeech
- Preparación corpus reuniones para Summarizer
- Validación calidad datos
Fase 2: Entrenamiento ASR
Entrenamiento del modelo ConformerASR (~30M parámetros) en GPU propio. Evaluación con métrica WER (Word Error Rate) y fine-tuning para vocabulario de reuniones.
- Entrenamiento en servidor propio (GPU)
- Optimización CTC Beam Search
- Evaluación WER español/inglés
- Fine-tuning en vocabulario técnico
Fase 3: Entrenamiento NLP
Entrenamiento del MeetingSummarizer (~15M params) y TaskExtractor (~8M params) sobre corpus anotado de reuniones. Validación de calidad de resúmenes y precisión de extracción.
- MeetingSummarizer Seq2Seq entrenado
- TaskExtractor con NER
- Evaluación ROUGE para resúmenes
- Calibración de confianza por tarea
Fase 4: Integración & Producción
Integración live del pipeline KRON con MeetingScribe desktop. Tests end-to-end, optimización de latencia, Docker para despliegue y monitorización en producción.
- Pipeline live ASR → Resumen → Tareas
- Integración MeetingScribe desktop
- Docker + servidor propio
- Latencia < 30s para resumen completo
Fase 5: Multi-producto & Evolución
KRON como cerebro de todos los productos DynamisAI. Nuevos modelos especializados según los casos de uso que vayan surgiendo, sistema de aprendizaje continuo y expansión multiidioma.
- KRON como base para nuevos productos DynamisAI
- Modelos especializados por dominio
- Aprendizaje continuo con datos de usuarios
- Expansión a más idiomas
KRON es un proyecto en evolución constante. Las fases y plazos se ajustan según los aprendizajes que vamos obteniendo durante el proceso.
¿Quieres ver KRON en acción?
KRON impulsa MeetingScribe. Cuando el producto esté listo, podrás probarlo en primera persona — con IA 100% propia, sin enviar tus datos a ningún servidor externo.