Ico_docTR

docTR

Bibliothèque open source en Python dédiée à l'analyse de documents pour les développeurs et les data scientists.

This is a preview of docTR

OCR en deep learning entraînable, conçu pour répondre aux cas d'utilisation les plus avancés en matière de compréhension de documents.

this is a docTR illustration

À la pointe de la technologie

Profitez des dernières avancées en computer vision pour relever les défis les plus complexes du traitement de documents.

Open source

Déployez une solution OCR personnalisée pouvant être hébergée dans votre infrastructure, afin de garantir le respect de vos politiques de confidentialité des données.

Entraînable

Atteignez des performances d'extraction de haut niveau à grande échelle, que ce soit aux États-Unis, en Europe ou pour tout alphabet latin, dans divers secteurs et industries.

Une bibliothèque complète dédiée à l'analyse de documents pour les développeurs et les data scientists.

OCR pré-entraîné

Une solution OCR en Python, prête à l'emploi, entraînée sur des millions de documents en alphabet latin.

Voir la documentation

De bout en bout

Pipeline OCR en deux étapes combinant des algorithmes de détection et de reconnaissance de texte.

Voir plus

Entrainement

Scripts d'entraînement pour la détection et la reconnaissance de texte, compatibles avec PyTorch et TensorFlow.

Voir les références

Datasets publics

Intégration native des datasets publics les plus réputés pour relever les défis de l'OCR.

Voir les datasets

Détection des artefacts

Algorithmes spécialisés pour identifier les codes QR, les codes-barres, les signatures et les visages.

Voir la documentation

Benchmark

Comparaison entre les différents modèles en termes de recall, de précision et de FPS.

Voir les benchmarks

TensorFlow JS

Inférence OCR dans un navigateur web avec TFJS.

Voir la démo

Application de démo locale

Générateur d'interface utilisateur pour les démonstrations locales, alimenté par Streamlit.

Voir la documentation

Compression du modèle

Prise en charge de la demi-précision et de la quantification pour optimiser vos modèles.

Voir la documentation