Tesseract.js يجلب صورة التعرف الضوئي على الحروف الترجمة إلى المتصفحات

لا تزال ترجمة التعرف الضوئي على الحروف غير كاملة لكنها تحسنت بشكل كبير خلال السنوات القليلة الماضية. يقود الطريق هو Tesseract محرك الترجمة مفتوح حاليا من مصادر في C++.

في حين أن هذه مكتبة لا تصدق ، إلا أنها تقتصر على البرامج. لحسن الحظ قام شخص ما بمنفذ Tesseract في JavaScript والذي يسمى Tesseract.js. هذا يدعم ما يصل إلى 60 لغة وعلى الرغم من أنها بالتأكيد ليست مثالية ، فإنها تؤدي المهمة بشكل جيد.

التثبيت والإعداد هو نسيم حيث يمكنك استهداف أي عنصر الصورة على الصفحة وتشغيل Tesseract.recognize () وظيفة. هذا يمكن أن يأخذ أي نوع من الصور ، وسوف تلقائيا ضغط وترجمة الحق في المتصفح.

يمكنك الحصول على الكثير أكثر تعقيدا ولكن الجمال كيف يمكنك تشغيل OCR مع سطر واحد من التعليمات البرمجية.

تحقق من الصفحة المقصودة Tesseract.js إذا كنت تريد مشاهدة عرض توضيحي مباشر. هذا يعمل بشكل صحيح في المتصفح حيث يمكنك قم بسحب وإسقاط أي صورة ممسوحة ضوئيًا للنص للحصول على ترجمة التعرف الضوئي على الحروف تلقائيًا.

يمكنك أيضًا تنزيل هذا المثال محليًا من خلال صفحة GitHub أو يمكنك إنشاء التطبيق الخاص بك عن طريق تضمين البرنامج النصي Tesseract.js مباشرةً من CDN.

أبسط مثال على الكود يشبه ما يلي صورتي هو إشارة مباشرة إلى عنصر صورة HTML:

 Tesseract.recognize (myImage) .then (function (result) console.log (result))؛

في كلتا الحالتين ، تكون هذه المكتبة مفيدة جدًا في التنقل باستخدام التعرف الضوئي على الحروف على الويب. انها بعيدة عن الكمال لكنها أيضا أفضل مورد لمطوري الويب الذين يريدون وظائف OCR ديناميكية في الصفحة.

لمعرفة المزيد ، تفضل بزيارة صفحة Tesseract.js GitHub حيث يمكنك الاطلاع على عرض توضيحي مباشر وتصفح الوثائق عبر الإنترنت.