C'EST QUOI ?
Tesseract.js est un port JavaScript du moteur OCR Tesseract, compilé en WebAssembly. Il permet d'extraire du texte depuis des images directement dans le navigateur ou côté serveur avec Node.js, sans aucune dépendance externe ni appel API. Tu lui passes une image, il te retourne le texte — c'est aussi simple que ça.
POURQUOI C'EST INTÉRESSANT ?
- 100+ langues supportées : Du français au chinois en passant par l'arabe et le russe, la couverture linguistique est massive. Détection automatique de l'orientation et du script incluse.
- Zéro backend nécessaire : Tout tourne dans le navigateur grâce à WebAssembly. Pas besoin de serveur pour faire de l'OCR, les données restent côté client.
- API simple et progressive : Un
recognize()suffit pour les cas basiques. Pour les scénarios avancés, un scheduler permet de paralléliser le traitement de plusieurs images simultanément. - Sortie granulaire : Au-delà du texte brut, Tesseract.js retourne des bounding boxes au niveau paragraphe, ligne, mot et caractère. Utile pour de l'annotation ou du post-traitement.
- Écosystème mature : 38k stars GitHub, 36k+ dépendants, version 7.0 stable. Le projet est activement maintenu et largement adopté en production.
CAS D'USAGE
- Extraction de texte depuis des photos de documents (factures, reçus, cartes de visite)
- Numérisation de contenu imprimé directement dans une app web sans upload serveur
- Sous-titrage ou indexation de texte incrusté dans des images et vidéos
- Accessibilité : conversion d'images textuelles en contenu lisible par les lecteurs d'écran
- Automatisation de saisie de données depuis des scans ou captures d'écran
