Convertir des documents
Escriba convertit presque tout en Markdown. La détection est automatique — vous avez rarement besoin de lui indiquer le type de fichier déposé.
Ce que vous pouvez convertir
Section intitulée « Ce que vous pouvez convertir »- Documents — PDF, Word, Excel, PowerPoint, HTML, CSV, EPUB, ZIP et plus encore.
- Images — OCR automatique (Tesseract) ; description par IA optionnelle.
- Audio et vidéo — transcription locale et hors ligne avec Whisper (mp3, wav, mp4, mov, mkv…).
- URL et YouTube — convertissez une page web, ou récupérez une transcription YouTube.
OCR intelligent
Section intitulée « OCR intelligent »Le texte contenu dans les images est reconnu automatiquement. Les PDF numérisés et pivotés sont détectés, passés à l’OCR et automatiquement redressés à la volée. Si un PDF semble numérisé et que votre niveau d’accès autorise l’OCR, Escriba l’applique sans que vous le demandiez.
Vous pouvez aussi forcer l’OCR depuis les options avancées — utile pour les PDF avec des accents corrompus (par ex. exportés depuis LaTeX). Forcer l’OCR utilise la langue du document que vous choisissez, définissez-la donc pour de meilleurs résultats.
Sélection de pages
Section intitulée « Sélection de pages »Pour les longs PDF, ne convertissez que les pages dont vous avez besoin. À côté de chaque PDF en file d’attente se trouve un sélecteur de pages qui affiche le nombre de pages du document et vous permet de choisir :
- Le document entier (par défaut).
- Une plage — par ex. les pages
5à67. - Des pages ou plages individuelles — par ex.
1, 6, 9, ou un mélange comme1, 2, 5-67.
Aucune syntaxe à mémoriser : le sélecteur est conçu pour ça. La sélection se fait par fichier, si bien que différents PDF d’un même lot peuvent utiliser des pages différentes.
Options avancées
Section intitulée « Options avancées »Ouvrez le panneau avancé pour affiner une conversion :
- Langue du document — améliore la transcription audio et l’OCR forcé.
- Forcer l’OCR — pour les PDF numérisés ou les accents corrompus.
- Extraction PDF avancée — un moteur OpenDataLoader activable à la demande pour les mises en page complexes : meilleur ordre de lecture et hiérarchie des titres, avec repli automatique vers l’extracteur par défaut. Plus lent, mais plus précis sur les documents délicats.
- Anonymisation — supprimez ou remplacez les données personnelles ; voir Anonymisation.
- Fournisseur d’IA — optionnel. La valeur par défaut est Pas d’IA (texte local / OCR uniquement).
Modifiez avant d’exporter ou de mettre en voix
Section intitulée « Modifiez avant d’exporter ou de mettre en voix »Le résultat n’est pas en lecture seule. Cliquez sur Modifier pour l’ouvrir dans un éditeur Markdown plein écran avec aperçu en direct, mettez-le au propre — supprimez le superflu, corrigez un titre, élaguez le bruit — puis Enregistrez. Vos modifications deviennent le résultat : tout ce qui suit (export, audio, copie et téléchargement) utilise le texte nettoyé. Rien n’est envoyé où que ce soit ; tout reste dans votre navigateur jusqu’à ce que vous agissiez.
Ajoutez plusieurs fichiers à la fois (votre niveau d’accès en définit le nombre). Convertissez-les
tous, puis téléchargez l’ensemble sous forme de .zip. Les fichiers téléversés sont supprimés juste après la
conversion — rien n’est conservé.