docTR

Star

Bibliothèque open source en Python dédiée à l'analyse de documents pour les développeurs et les data scientists.

Voir sur Github

Parlez à un expert

OCR en deep learning entraînable, conçu pour répondre aux cas d'utilisation les plus avancés en matière de compréhension de documents.

À la pointe de la technologie

Profitez des dernières avancées en computer vision pour relever les défis les plus complexes du traitement de documents.

Open source

Déployez une solution OCR personnalisée pouvant être hébergée dans votre infrastructure, afin de garantir le respect de vos politiques de confidentialité des données.

Entraînable

Atteignez des performances d'extraction de haut niveau à grande échelle, que ce soit aux États-Unis, en Europe ou pour tout alphabet latin, dans divers secteurs et industries.

Une bibliothèque complète dédiée à l'analyse de documents pour les développeurs et les data scientists.

OCR pré-entraîné

Une solution OCR en Python, prête à l'emploi, entraînée sur des millions de documents en alphabet latin.

Voir la documentation

De bout en bout

Pipeline OCR en deux étapes combinant des algorithmes de détection et de reconnaissance de texte.

Entrainement

Scripts d'entraînement pour la détection et la reconnaissance de texte, compatibles avec PyTorch et TensorFlow.

Voir les références

Datasets publics

Intégration native des datasets publics les plus réputés pour relever les défis de l'OCR.

Voir les datasets

Détection des artefacts

Algorithmes spécialisés pour identifier les codes QR, les codes-barres, les signatures et les visages.

Voir la documentation

Benchmark

Comparaison entre les différents modèles en termes de recall, de précision et de FPS.

Voir les benchmarks

TensorFlow JS

Inférence OCR dans un navigateur web avec TFJS.

Voir la démo

Application de démo locale

Générateur d'interface utilisateur pour les démonstrations locales, alimenté par Streamlit.

Voir la documentation

Compression du modèle

Prise en charge de la demi-précision et de la quantification pour optimiser vos modèles.

Voir la documentation

Toute la documentation

Une approche de l'OCR en deux étapes permettant un entrainement complet

Obtenez une précision maximale en entraînant les couches de détection et de reconnaissance de texte adaptées à votre problème spécifique.

Modèles de détection

Modèles de reconnaissance

Voir la démo sur Hugging Face

Mindee use cookies to give you the best online experience. Cookies allows us to improve your website browsing experience and measure statistics associated with your visits. By continuing to browse or use our services, you accept the use of cookies in accordance with our privacy policy.

docTR

OCR en deep learning entraînable, conçu pour répondre aux cas d'utilisation les plus avancés en matière de compréhension de documents.

À la pointe de la technologie

Open source

Entraînable

Une bibliothèque complète dédiée à l'analyse de documents pour les développeurs et les data scientists.

OCR pré-entraîné

De bout en bout

Entrainement

Datasets publics

Détection des artefacts

Benchmark

TensorFlow JS

Application de démo locale

Compression du modèle

Une approche de l'OCR en deux étapes permettant un entrainement complet

Vous avez d'autres questions ?

Envoyez nous un message

Discutons !