الصفحة الرئيسية » تنزيلات البرامج المجانية » استخراج النص من ملفات PDF والصورة

    استخراج النص من ملفات PDF والصورة

    هل لديك وثيقة PDF تريد استخراج كل النص منها؟ ماذا عن ملفات الصور من وثيقة ممسوحة ضوئيًا تريد تحويلها إلى نص قابل للتحرير؟ هذه بعض المشكلات الأكثر شيوعًا التي رأيتها في مكان العمل عند العمل مع الملفات.

    في هذه المقالة ، سأتحدث عن عدة طرق مختلفة يمكنك من خلالها محاولة استخراج نص من ملف PDF أو من صورة. ستختلف نتائج الاستخراج حسب نوع وجودة النص في PDF أو الصورة. أيضًا ، ستختلف نتائجك حسب الأداة التي تستخدمها ، لذلك من الأفضل تجربة أكبر عدد ممكن من الخيارات أدناه للحصول على أفضل النتائج.

    استخراج النص من الصورة أو PDF

    إن أبسط وأسرع طريقة للبدء هي تجربة خدمة استخراج نصوص PDF عبر الإنترنت. هذه عادة مجانية ويمكن أن تمنحك بالضبط ما تبحث عنه دون الحاجة إلى تثبيت أي شيء على جهاز الكمبيوتر الخاص بك. فيما يلي نوعان استخدمتهما من نتائج جيدة إلى ممتازة:

    ExtractPDF

    ExtractPDF هي أداة مجانية لالتقاط الصور والنصوص والخطوط من ملف PDF. القيد الوحيد هو أن الحد الأقصى لحجم ملف PDF هو 10 ميغابايت. هذا صغير بعض الشيء ؛ لذلك إذا كان لديك ملف أكبر ، فجرّب بعض الطرق الأخرى أدناه. اختر ملفك ثم انقر فوق إرسال ملف زر. عادة ما تكون النتائج سريعة جدًا ، ويجب أن ترى معاينة للنص عند النقر فوق علامة التبويب "نص".

    إنها فائدة إضافية لطيفة أيضًا ، حيث تقوم باستخراج الصور من ملف PDF أيضًا ، فقط في حالة احتياجك إليها! بشكل عام ، تعمل الأداة عبر الإنترنت بشكل رائع ، لكنني واجهت بعض مستندات PDF التي تمدني بمخرجات مضحكة. يتم استخراج النص على ما يرام ، ولكن لسبب ما سيكون له فاصل أسطر بعد كل كلمة! ليست مشكلة كبيرة لملف PDF قصير ، ولكن بالتأكيد مشكلة للملفات مع الكثير من النص. إذا حدث ذلك لك ، فجرب الأداة التالية.

    التعرف الضوئي على الحروف على الانترنت

    تميل OCR عبر الإنترنت عادةً إلى العمل مع المستندات التي لم يتم تحويلها بشكل صحيح باستخدام ExtractPDF ، لذلك من الجيد تجربة كلتا الخدمتين لمعرفة أيهما يمنحك مخرجات أفضل. يحتوي OCR عبر الإنترنت أيضًا على بعض الميزات الرائعة التي يمكن أن تكون مفيدة لأي شخص لديه ملف PDF كبير يحتاج فقط إلى تحويل النص على بضع صفحات بدلاً من المستند بأكمله.

    أول شيء تريد القيام به هو المضي قدمًا وإنشاء حساب مجاني. إنه أمر مزعج بعض الشيء ، ولكن إذا لم تقم بإنشاء حساب مجاني ، فسوف يحول ملف PDF الخاص بك جزئيًا فقط بدلاً من المستند بأكمله. أيضًا ، بدلاً من فقط القدرة على تحميل مستند 5 ميغابايت فقط ، يمكنك تحميل ما يصل إلى 100 ميغابايت لكل ملف باستخدام حساب.

    أولاً ، اختر لغة ثم اختر نوع تنسيقات الإخراج التي تريدها للملف المحول. لديك خياران ويمكنك اختيار أكثر من خيار إذا أردت. تحت وثيقة متعددة الصفحات, يمكنك الاختيار أرقام الصفحات ثم اختر فقط الصفحات التي تريد تحويلها. ثم حدد الملف وانقر تحول!

    بعد التحويل ، سيتم توجيهك إلى قسم "المستندات" (إذا قمت بتسجيل الدخول) حيث يمكنك معرفة عدد الصفحات المجانية المتبقية لديك والارتباطات لتنزيل ملفاتك المحولة. يبدو أنك لا تملك سوى 25 صفحة مجانًا يوميًا ، لذلك إذا كنت بحاجة إلى أكثر من ذلك ، فيجب عليك إما الانتظار قليلاً أو شراء المزيد من الصفحات.

    قام OCR عبر الإنترنت بعمل ممتاز لتحويل ملفات PDF الخاصة بي لأنه كان قادرًا على الحفاظ على التصميم الفعلي للنص. في الاختبار الذي أجريته ، أخذت مستند Word يستخدم الرموز النقطية وأحجام الخطوط المختلفة وما إلى ذلك وقم بتحويله إلى PDF. ثم استخدمت "التعرف الضوئي على الحروف عبر الإنترنت" لتحويله مرة أخرى إلى تنسيق Word وكان حوالي 95٪ مثل الأصلي. هذا مثير للإعجاب جدا بالنسبة لي.

    بالإضافة إلى ذلك ، إذا كنت تتطلع إلى تحويل صورة إلى نص ، فيمكنك القيام بذلك عبر الإنترنت OCR بنفس سهولة استخراج النص من ملفات PDF.

    على الانترنت مجانا التعرف الضوئي على الحروف

    منذ أن كنت تتحدث عن صورة إلى نص التعرف الضوئي على الحروف ، اسمحوا لي أن أذكر موقع جيد آخر يعمل بشكل جيد على الصور. كانت ميزة OCR المجانية على الإنترنت جيدة جدًا ودقيقة جدًا عند استخراج نص من صور الاختبار الخاصة بي. التقطت صورتين من صفحات iPhone الخاصة بي من الكتب والمنشورات وغيرها ، وقد فوجئت بمدى القدرة على تحويل النص..

    اختر الملف الخاص بك ثم انقر فوق الزر "تحميل". في الشاشة التالية ، يوجد خياران ومعاينة للصورة. يمكنك اقتصاصها إذا كنت لا ترغب في التعرف الضوئي على الحروف على كل شيء. ثم انقر فقط فوق الزر OCR وسيظهر النص المحول أسفل معاينة الصورة. كما أنه لا يحتوي على أي قيود ، وهو أمر رائع حقًا.

    بالإضافة إلى الخدمات عبر الإنترنت ، هناك محولان مجانيان من ملفات PDF أريد أن أذكرهما إذا كنت بحاجة إلى برنامج يعمل محليًا على جهاز الكمبيوتر الخاص بك لإجراء التحويلات. مع الخدمات عبر الإنترنت ، ستحتاج دائمًا إلى اتصال بالإنترنت وقد لا يكون ذلك ممكنًا للجميع. ومع ذلك ، لاحظت أن جودة التحويلات من برامج مجانية كانت أسوأ بكثير من جودة تلك المواقع.

    النازع قوات الدفاع الشعبي النص

    A-PDF Text Extractor هو برنامج مجاني يقوم بعمل جيد إلى حد ما لاستخراج النص من ملفات PDF. بمجرد تنزيله وتثبيته ، انقر فوق الزر "فتح" لاختيار ملف PDF الخاص بك. ثم انقر فوق استخراج النص لبدء العملية.

    سيطلب منك موقعًا لتخزين ملف الإخراج النصي ، ثم يبدأ في الاستخراج. يمكنك أيضا النقر على اختيار الذي يتيح لك اختيار صفحات معينة فقط لاستخراج ونوع الاستخراج. الخيار الثاني مثير للاهتمام لأنه يستخرج النص في تخطيطات مختلفة ويستحق المحاولة الثلاثة لمعرفة أي منها يمنحك أفضل إخراج.

    PDF2Text Pilot

    PDF2Text Pilot يقوم بعمل جيد لاستخراج النص. ليس لديها أي خيارات ؛ يمكنك فقط إضافة ملفات أو مجلدات وتحويل والأمل في الأفضل. لقد نجحت بشكل جيد في بعض ملفات PDF ، ولكن بالنسبة إلى معظمها ، كانت هناك العديد من المشكلات.

    فقط انقر فوق "إضافة ملفات" ثم انقر فوق "نعم" تحول. بمجرد اكتمال التحويل ، انقر فوق "استعراض" لفتح الملف. ستختلف الأميال باستخدام هذا البرنامج ، لذلك لا تتوقع الكثير.

    تجدر الإشارة أيضًا إلى أنه إذا كنت في بيئة شركة أو يمكنك الحصول على نسخة من Adobe Acrobat من العمل ، فيمكنك حقًا الحصول على نتائج أفضل بكثير. من الواضح أن Acrobat ليس مجانيًا ، لكن لديه خيارات لتحويل PDF إلى تنسيق Word و Excel و HTML. كما أنه يقوم بأفضل وظيفة في الحفاظ على بنية المستند الأصلي وتحويل النص المعقد.