Panneau de préparation LLM

Chaque conversion s’accompagne d’un panneau compact qui prépare le texte pour un modèle — entièrement en local, sans aucun appel d’IA.

Ce qu’il affiche

Comptage de tokens avec tiktoken (o200k_base, intégré à l’image — fonctionne hors ligne).
Tokens & coût économisés par l’anonymisation, pour voir ce que vous rapporte le retrait des données personnelles.
Estimation de coût par modèle en temps réel — tarifs et fenêtres de contexte tirés d’ OpenRouter (des centaines de modèles, mis en cache) pour que les chiffres ne soient jamais périmés.
Adéquation à la fenêtre de contexte — en un coup d’œil, les modèles dans lesquels le document rentre.
Découpage RAG en un clic — découpe en morceaux chevauchants et bornés en tokens (semchunk), téléchargeables en .jsonl.
Détecteur d’injection de prompt — signale les textes qui tentent de détourner un LLM en aval.

Simuler le coût par modèle

Le panneau démarre avec aucun modèle sélectionné — choisissez ceux qui vous intéressent et Escriba estime le coût de l’envoi de ce document exact à chacun, à partir d’une tarification en temps réel. C’est le moyen le plus rapide de répondre à « quel modèle utiliser, et combien ça va coûter ? » avant de dépenser le moindre centime.

Découpage RAG

Un clic découpe le Markdown en morceaux chevauchants et bornés en tokens, adaptés à une chaîne de récupération, téléchargeables en .jsonl. Utile quand le document dépasse la fenêtre de contexte de votre modèle cible.

Tout cela tourne sur votre serveur. Aucune clé d’API, aucun appel externe — juste du calcul local sur le texte que vous avez converti.