Investigación & Desarrollo

KRON

La inteligencia artificial que construimos desde cero.

Ningún API externo. Ningún proveedor de terceros. Cada modelo entrenado con nuestros datos, en nuestro hardware, bajo nuestro control total.

~53M

Parámetros totales

3

Modelos propios

0

APIs externas

100%

PyTorch propio

Por qué

¿Por qué construir la IA desde cero?

Usar la API de OpenAI es fácil. Construir la tuya propia es difícil. Elegimos lo difícil porque las razones importan.

Control total

Si dependes de OpenAI o cualquier otro proveedor, ellos controlan tus precios, tu disponibilidad y tus datos. Con KRON, controlamos cada capa del stack.

Sin coste por token

Las APIs externas cobran por cada llamada. KRON corre en nuestro servidor: coste fijo, sin sorpresas, sin límites artificiales de uso.

Diseñada para escalar

KRON no es un modelo monolítico. Es un sistema modular con pipeline de plugins: cada producto nuevo de DynamisAI puede conectarse sin reescribir nada.

Propiedad intelectual

Cada peso entrenado es nuestro. No cedemos datos a terceros para mejorar sus modelos. Lo que entrenamos con nuestros datos, nos pertenece.

"KRON no es solo la IA de MeetingScribe. Es la base sobre la que construiremos todos los productos de DynamisAI. Un cerebro compartido que aprende y mejora con cada producto que desarrollamos."

— DynamisAI

Arquitectura

Tres modelos, un pipeline

KRON no es un modelo único. Es un sistema de tres modelos especializados que trabajan en cadena: audio entra, resumen e tareas salen.

ASR

ConformerASR

~30M parámetros

Reconocimiento de voz

Arquitectura Conformer (CNN + Transformer) optimizada para transcripción de audio en reuniones. Entrena sobre datos de audio en español e inglés con decodificación CTC Beam Search.

  • Encoder Conformer multicapa
  • CTC Head para decodificación
  • Log-Mel features (80 bins)
  • SpecAugment para robustez
  • VAD integrado
NLP

MeetingSummarizer

~15M parámetros

Resumen de reuniones

Modelo Seq2Seq Transformer entrenado específicamente para condensar transcripciones de reuniones en resúmenes ejecutivos concisos con los puntos clave.

  • Arquitectura Encoder-Decoder
  • Tokenizer BPE (vocab 8.000)
  • Fine-tuning en datos de reuniones
  • Multiidioma (ES + EN)
EXT

TaskExtractor

~8M parámetros

Extracción de tareas

Modelo de clasificación y extracción de entidades entrenado para detectar compromisos, tareas asignadas y decisiones dentro del texto de una transcripción.

  • Clasificación de secuencias
  • NER para detectar asignados
  • Extracción de fechas/plazos
  • Confianza por tarea

Stack completo

Productos (MeetingScribe, futuros...)
FastAPI REST — /v1/asr, /v1/nlp, /v1/pipeline
Sistema de plugins (auto-discovery)
Pipeline: ASR → Summarize → Extract Tasks
Modelos KRON (PyTorch)
Servidor propio — sin datos externos
Autenticación via API Key · SQLite / PostgreSQL · Jobs asíncronos

Estado actual

Fase 0 completada

Los fundamentos están construidos. La arquitectura completa está en código. El siguiente paso es el entrenamiento de los modelos.

Completado — Fase 0

  • Arquitectura completa definida y estructurada
  • ConformerASR — código del modelo completo (encoder, CTC head)
  • MeetingSummarizer — arquitectura Seq2Seq implementada
  • TaskExtractor — modelo de clasificación implementado
  • Audio pipeline: preprocesado, Log-Mel features, VAD, SpecAugment
  • KronTokenizer BPE (sentencepiece, vocab 8.000)
  • FastAPI REST con todos los routers (/asr, /nlp, /pipeline, /health)
  • Sistema de plugins con auto-discovery
  • MeetingPipeline: ASR → summarize → extract tasks
  • JobManager — jobs asíncronos con asyncio
  • Almacenamiento SQLite/PostgreSQL con SQLAlchemy async
  • Scripts de entrenamiento listos para los 3 modelos

Próximas fases

  • Entrenar tokenizer BPE con corpus en español/inglés
  • Descargar y preparar datasets de audio (LibriSpeech, Common Voice ES)
  • Entrenamiento del modelo ASR (~30M params) en GPU
  • Validación y evaluación WER del ASR
  • Entrenamiento del MeetingSummarizer en corpus de reuniones
  • Entrenamiento del TaskExtractor
  • Integración live con MeetingScribe desktop
  • Pruebas end-to-end del pipeline completo

Progreso global del proyecto

~25%
Arquitectura ✓EntrenamientoIntegraciónProducción

Roadmap

El camino que estamos recorriendo

De la arquitectura al modelo entrenado, hasta el producto en manos de los usuarios. Aquí está el plan completo, fase por fase.

Fase 0: Fundamentos

Completado

Diseño completo de la arquitectura, implementación de los tres modelos en PyTorch, pipeline de audio, tokenizer BPE, API REST con FastAPI y sistema de plugins.

  • Arquitectura ConformerASR, Summarizer, TaskExtractor
  • FastAPI + routers completos
  • Plugin system con auto-discovery
  • Training scripts listos
1

Fase 1: Tokenizer & Datos

Siguiente

Entrenamiento del tokenizer BPE con corpus en español e inglés, descarga y preparación de los datasets de audio (CommonVoice ES, LibriSpeech EN) y corpus de texto de reuniones.

  • Entrenamiento KronTokenizer (vocab 8k)
  • Descarga CommonVoice ES + LibriSpeech
  • Preparación corpus reuniones para Summarizer
  • Validación calidad datos
2

Fase 2: Entrenamiento ASR

Próximamente

Entrenamiento del modelo ConformerASR (~30M parámetros) en GPU propio. Evaluación con métrica WER (Word Error Rate) y fine-tuning para vocabulario de reuniones.

  • Entrenamiento en servidor propio (GPU)
  • Optimización CTC Beam Search
  • Evaluación WER español/inglés
  • Fine-tuning en vocabulario técnico
3

Fase 3: Entrenamiento NLP

Próximamente

Entrenamiento del MeetingSummarizer (~15M params) y TaskExtractor (~8M params) sobre corpus anotado de reuniones. Validación de calidad de resúmenes y precisión de extracción.

  • MeetingSummarizer Seq2Seq entrenado
  • TaskExtractor con NER
  • Evaluación ROUGE para resúmenes
  • Calibración de confianza por tarea
4

Fase 4: Integración & Producción

Próximamente

Integración live del pipeline KRON con MeetingScribe desktop. Tests end-to-end, optimización de latencia, Docker para despliegue y monitorización en producción.

  • Pipeline live ASR → Resumen → Tareas
  • Integración MeetingScribe desktop
  • Docker + servidor propio
  • Latencia < 30s para resumen completo
5

Fase 5: Multi-producto & Evolución

Futuro

KRON como cerebro de todos los productos DynamisAI. Nuevos modelos especializados según los casos de uso que vayan surgiendo, sistema de aprendizaje continuo y expansión multiidioma.

  • KRON como base para nuevos productos DynamisAI
  • Modelos especializados por dominio
  • Aprendizaje continuo con datos de usuarios
  • Expansión a más idiomas

KRON es un proyecto en evolución constante. Las fases y plazos se ajustan según los aprendizajes que vamos obteniendo durante el proceso.

¿Quieres ver KRON en acción?

KRON impulsa MeetingScribe. Cuando el producto esté listo, podrás probarlo en primera persona — con IA 100% propia, sin enviar tus datos a ningún servidor externo.