Investigación & Desarrollo

KRON

La inteligencia artificial que construimos desde cero.

Ningún API externo. Ningún proveedor de terceros. Cada modelo entrenado con nuestros datos, en nuestro hardware, bajo nuestro control total.

Ver arquitectura técnica Roadmap →

~53M

Parámetros totales

Modelos propios

APIs externas

100%

PyTorch propio

Por qué

¿Por qué construir la IA desde cero?

Usar la API de OpenAI es fácil. Construir la tuya propia es difícil. Elegimos lo difícil porque las razones importan.

Control total

Si dependes de OpenAI o cualquier otro proveedor, ellos controlan tus precios, tu disponibilidad y tus datos. Con KRON, controlamos cada capa del stack.

Sin coste por token

Las APIs externas cobran por cada llamada. KRON corre en nuestro servidor: coste fijo, sin sorpresas, sin límites artificiales de uso.

Diseñada para escalar

KRON no es un modelo monolítico. Es un sistema modular con pipeline de plugins: cada producto nuevo de DynamisAI puede conectarse sin reescribir nada.

Propiedad intelectual

Cada peso entrenado es nuestro. No cedemos datos a terceros para mejorar sus modelos. Lo que entrenamos con nuestros datos, nos pertenece.

"KRON no es solo la IA de MeetingScribe. Es la base sobre la que construiremos todos los productos de DynamisAI. Un cerebro compartido que aprende y mejora con cada producto que desarrollamos."

— DynamisAI

Arquitectura

Tres modelos, un pipeline

KRON no es un modelo único. Es un sistema de tres modelos especializados que trabajan en cadena: audio entra, resumen e tareas salen.

ASR

ConformerASR

~30M parámetros

Reconocimiento de voz

Arquitectura Conformer (CNN + Transformer) optimizada para transcripción de audio en reuniones. Entrena sobre datos de audio en español e inglés con decodificación CTC Beam Search.

›Encoder Conformer multicapa
›CTC Head para decodificación
›Log-Mel features (80 bins)
›SpecAugment para robustez
›VAD integrado

NLP

MeetingSummarizer

~15M parámetros

Resumen de reuniones

Modelo Seq2Seq Transformer entrenado específicamente para condensar transcripciones de reuniones en resúmenes ejecutivos concisos con los puntos clave.

›Arquitectura Encoder-Decoder
›Tokenizer BPE (vocab 8.000)
›Fine-tuning en datos de reuniones
›Multiidioma (ES + EN)

EXT

TaskExtractor

~8M parámetros

Extracción de tareas

Modelo de clasificación y extracción de entidades entrenado para detectar compromisos, tareas asignadas y decisiones dentro del texto de una transcripción.

›Clasificación de secuencias
›NER para detectar asignados
›Extracción de fechas/plazos
›Confianza por tarea

Stack completo

Productos (MeetingScribe, futuros...)

FastAPI REST — /v1/asr, /v1/nlp, /v1/pipeline

Sistema de plugins (auto-discovery)

Pipeline: ASR → Summarize → Extract Tasks

Modelos KRON (PyTorch)

Servidor propio — sin datos externos

Autenticación via API Key · SQLite / PostgreSQL · Jobs asíncronos

Estado actual

Fase 0 completada

Los fundamentos están construidos. La arquitectura completa está en código. El siguiente paso es el entrenamiento de los modelos.

Completado — Fase 0

✓Arquitectura completa definida y estructurada
✓ConformerASR — código del modelo completo (encoder, CTC head)
✓MeetingSummarizer — arquitectura Seq2Seq implementada
✓TaskExtractor — modelo de clasificación implementado
✓Audio pipeline: preprocesado, Log-Mel features, VAD, SpecAugment
✓KronTokenizer BPE (sentencepiece, vocab 8.000)
✓FastAPI REST con todos los routers (/asr, /nlp, /pipeline, /health)
✓Sistema de plugins con auto-discovery
✓MeetingPipeline: ASR → summarize → extract tasks
✓JobManager — jobs asíncronos con asyncio
✓Almacenamiento SQLite/PostgreSQL con SQLAlchemy async
✓Scripts de entrenamiento listos para los 3 modelos

Próximas fases

○Entrenar tokenizer BPE con corpus en español/inglés
○Descargar y preparar datasets de audio (LibriSpeech, Common Voice ES)
○Entrenamiento del modelo ASR (~30M params) en GPU
○Validación y evaluación WER del ASR
○Entrenamiento del MeetingSummarizer en corpus de reuniones
○Entrenamiento del TaskExtractor
○Integración live con MeetingScribe desktop
○Pruebas end-to-end del pipeline completo

Progreso global del proyecto

~25%

Arquitectura ✓EntrenamientoIntegraciónProducción

Roadmap

El camino que estamos recorriendo

De la arquitectura al modelo entrenado, hasta el producto en manos de los usuarios. Aquí está el plan completo, fase por fase.

✓

Fase 0: Fundamentos

Completado

Diseño completo de la arquitectura, implementación de los tres modelos en PyTorch, pipeline de audio, tokenizer BPE, API REST con FastAPI y sistema de plugins.

Arquitectura ConformerASR, Summarizer, TaskExtractor
FastAPI + routers completos
Plugin system con auto-discovery
Training scripts listos

Fase 1: Tokenizer & Datos

Entrenamiento del tokenizer BPE con corpus en español e inglés, descarga y preparación de los datasets de audio (CommonVoice ES, LibriSpeech EN) y corpus de texto de reuniones.

Entrenamiento KronTokenizer (vocab 8k)
Descarga CommonVoice ES + LibriSpeech
Preparación corpus reuniones para Summarizer
Validación calidad datos

Fase 2: Entrenamiento ASR

Próximamente

Entrenamiento del modelo ConformerASR (~30M parámetros) en GPU propio. Evaluación con métrica WER (Word Error Rate) y fine-tuning para vocabulario de reuniones.

Entrenamiento en servidor propio (GPU)
Optimización CTC Beam Search
Evaluación WER español/inglés
Fine-tuning en vocabulario técnico

Fase 3: Entrenamiento NLP

Próximamente

Entrenamiento del MeetingSummarizer (~15M params) y TaskExtractor (~8M params) sobre corpus anotado de reuniones. Validación de calidad de resúmenes y precisión de extracción.

MeetingSummarizer Seq2Seq entrenado
TaskExtractor con NER
Evaluación ROUGE para resúmenes
Calibración de confianza por tarea

Fase 4: Integración & Producción

Próximamente

Integración live del pipeline KRON con MeetingScribe desktop. Tests end-to-end, optimización de latencia, Docker para despliegue y monitorización en producción.

Pipeline live ASR → Resumen → Tareas
Integración MeetingScribe desktop
Docker + servidor propio
Latencia < 30s para resumen completo

Fase 5: Multi-producto & Evolución

Futuro

KRON como cerebro de todos los productos DynamisAI. Nuevos modelos especializados según los casos de uso que vayan surgiendo, sistema de aprendizaje continuo y expansión multiidioma.

KRON como base para nuevos productos DynamisAI
Modelos especializados por dominio
Aprendizaje continuo con datos de usuarios
Expansión a más idiomas

KRON es un proyecto en evolución constante. Las fases y plazos se ajustan según los aprendizajes que vamos obteniendo durante el proceso.

¿Quieres ver KRON en acción?

KRON impulsa MeetingScribe. Cuando el producto esté listo, podrás probarlo en primera persona — con IA 100% propia, sin enviar tus datos a ningún servidor externo.

Ver MeetingScribe →Contactar con nosotros