Ir al contenido

La Suite Escriba

La Suite Escriba es una familia de herramientas open source y self-hosted para una sola tarea: convertir cualquier fuente en datos limpios, privados y listos para modelos. Cada herramienta es excelente por su cuenta — pero fueron diseñadas como un solo instrumento.

Escriba es el hub: el traductor universal que toma un documento y produce Markdown limpio y anonimizado, listo para cualquier LLM. A su alrededor orbitan cuatro especialistas, cada uno el mejor capturando un tipo de fuente y devolviéndoselo al hub.

Escriba — el hub

Documentos, audio, video y páginas → Markdown limpio, con redacción de PII, OCR, transcripción, exportación a más de 10 formatos y un modo podcast.

Fisherboy — captura web

Cualquier URL → Markdown o datos estructurados, con anti-bloqueo escalonado, descargas de archivos/videos/galerías y una araña de secciones.

Anonimal — motor de privacidad

La capa de anonimización seria: ML/NER local más regex, opaca o reversible. Los satélites se conectan a ella.

Fulgoria — datos de documentos

Extractos bancarios, PDF e imágenes → filas CSV junto con una plantilla reutilizable, todo en el navegador.

Selega — control financiero

Estados financieros validados por 14 controles cruzados numéricos en vivo, que proponen el resultado de la legalización.

  • Self-hosted. Una única imagen Docker (o un pequeño archivo compose) que ejecutas en tu propio hardware. Tus archivos nunca tocan una nube de terceros.
  • Open source. MIT o Apache-2.0. Tuyas para leer, hacer fork e implementar.
  • Privadas por diseño. No se guarda nada una vez terminado el trabajo; la parte sensible ocurre localmente.
  • Un aspecto, siete idiomas. La misma interfaz — English, Español, Français, Português, Italiano, 中文, 日本語 — autodetectada e intercambiable.

La suite se siente como un solo producto porque cada app honra dos contratos simples.

Cada app usa el mismo lenguaje de diseño: tema claro por defecto con un modo oscuro, la misma tipografía (Inter Variable + JetBrains Mono), iconos de línea en lugar de emojis, y los mismos componentes — cada app con su propio color de acento para que siempre sepas dónde estás.

HerramientaAcentoRol
EscribaCoral #e06a3aEl hub
FisherboyOcean teal #0f8f6aCaptura web
AnonimalMask indigo #4a4e7cMotor de privacidad
FulgoriaViolet #6c5cf0Datos de documentos
SelegaBordó #a8324aControl financiero

Cualquier satélite puede entregar su resultado al hub sin un ida y vuelta a un servidor. Escribe el contenido capturado en el sessionStorage del navegador bajo escriba.handoff usando un pequeño contrato JSON, y luego abre Escriba — que lo lee y crea un elemento listo para usar.

{
"from": "fisherboy",
"version": 1,
"title": "Captured page",
"source": "https://example.com/article",
"mime": "text/markdown",
"content": "# Clean markdown…",
"alt": { "csv": "…optional…" },
"ts": 1719000000000
}

Anonimal es el dueño de la anonimización seria en la suite — el motor completo de ML/NER + Privacy-Filter. Para seguir siendo usables por su cuenta, los satélites también incluyen un regex mínimo integrado para no depender nunca de nada al ejecutarse en modo standalone.

Cuando apuntas un satélite a Anonimal (mediante una variable de entorno ANONIMAL_URL), desbloqueas toda la potencia — nombres incluidos — y falla cerrado si Anonimal no está disponible, en lugar de degradar silenciosamente a regex. La privacidad nunca se degrada por accidente.

Cada herramienta se ejecuta de forma independiente, pero la topología prevista para la experiencia completa es un dominio detrás de un reverse proxy, de modo que cada app sea del mismo origen. Eso hace que el diseño se sienta sin costuras y permite que el handoff por sessionStorage funcione en toda la suite.