
MarkItDown
Utilitaire Python signé Microsoft pour convertir PDF, Word, Excel, images et audio en Markdown propre. Pensé pour alimenter LLM et pipelines d'analyse.
3 entrées étiquetées "ocr"

Utilitaire Python signé Microsoft pour convertir PDF, Word, Excel, images et audio en Markdown propre. Pensé pour alimenter LLM et pipelines d'analyse.

Suite open-source auto-hébergeable avec 50+ outils pour manipuler vos PDF : fusion, split, OCR, signature, conversion, compression et API REST intégrée.

Bibliothèque JavaScript d'OCR qui tourne dans le navigateur et Node.js. Reconnaissance de texte en 100+ langues via WebAssembly, sans serveur requis.