كيفية استخراج وحفظ الصور من ملف PDF في لينكس
يمكنك بسهولة تحويل ملفات PDF إلى نص قابل للتحرير في Linux باستخدام أداة سطر الأوامر "pdftotext". ومع ذلك ، إذا كانت هناك أي صور في ملف PDF الأصلي ، فلن يتم استخراجها. لاستخراج الصور من ملف PDF ، يمكنك استخدام أداة سطر أوامر أخرى تسمى "pdfimages".
ملاحظة: عندما نقول لكتابة شيء ما في هذه المقالة وهناك اقتباسات حول النص ، لا تكتب علامات الاقتباس ، ما لم نحدد خلاف ذلك.
تمثل أداة "pdfimages" جزءًا من حزمة poppler-utils. يمكنك التحقق لمعرفة ما إذا كان مثبتًا على نظامك وتثبيته إذا لزم الأمر باستخدام الخطوات الموضحة في هذه المقالة.
لاستخراج الصور من ملف PDF باستخدام pdfimages ، اضغط على "Ctrl + Alt + T" لفتح نافذة طرفية. اكتب الأمر التالي في الموجه.
pdfimages /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
ملاحظة: بالنسبة لجميع الأوامر الموضحة في هذه المقالة ، استبدل المسار الأول في الأمر واسم ملف PDF إلى المسار واسم ملف PDF الأصلي. يجب أن يكون المسار الثاني هو المسار إلى المجلد الجذر الذي تريد حفظ الصور المستخرجة فيه. تمثل كلمة "صورة" في نهاية المسار الثاني كل ما تريد أن تحمل اسم الملف الخاص بك. يتم ترقيم أسماء الملفات تلقائيًا (000 ، 001 ، 002 ، 003 ، وما إلى ذلك). إذا كنت تريد إضافة نص إلى بداية كل صورة ، فأدخل هذا النص في نهاية المسار الثاني. في مثالنا ، سيبدأ كل اسم صورة مع "image" ، مثل image-001.ppm ، image-002.ppm ، إلخ. يتم إضافة شرطة بين النص الذي تحدده والرقم.
تنسيق الصورة الافتراضي هو PPM (Portable pixmap) للصور غير أحادية اللون ، أو PBM (صورة نقطية محمولة) للصور أحادية اللون. تم تصميم هذه التنسيقات لتبادلها بسهولة بين الأنظمة الأساسية.
ملاحظة: قد تحصل على ملفي صور لكل صورة في ملف PDF الخاص بك. الصورة الثانية لكل صورة فارغة ، لذلك ، ستتمكن من معرفة الصور التي تحتوي على الصور من الملف بواسطة الصورة المصغرة في الملف في مدير الملفات.
لإنشاء ملفات صور .jpg ، قم بإضافة خيار "-j" إلى الأمر ، كما هو موضح أدناه.
pdfimages -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
ملاحظة: يمكنك أيضًا تغيير الإخراج الافتراضي إلى PNG باستخدام الخيار "-png" أو TIFF باستخدام خيار "-tiff".
يتم حفظ ملف الصورة الرئيسي لكل صورة كملف jpg. الصورة الفارغة الثانية لا تزال ملف. pm أو. pbm.
إذا كنت تريد فقط تحويل الصور في صفحة معينة وبعدها ، فاستخدم خيار "-f" برقم للإشارة إلى الصفحة الأولى المراد تحويلها ، كما هو موضح في مثال الأمر أدناه.
pdfimages -f 2 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
ملاحظة: قمنا بدمج الخيار "-j" مع خيار "-f" حتى نحصل على صور .jpg ونفعل الشيء نفسه مع الخيار "-l" المذكور أدناه أيضًا.
لتحويل كل الصور قبل أو على صفحة معينة ، استخدم "-l" (حرف صغير "L" ، وليس الخيار "1") مع رقم يشير إلى آخر صفحة لتحويلها ، كما هو موضح أدناه.
pdfimages -l 1 -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
ملاحظة: يمكنك استخدام الخيارين "-f" و "-l" معًا لتحويل الصور في نطاق صفحات محدد في منتصف المستند الخاص بك.
إذا كانت هناك كلمة مرور للمالك في ملف PDF ، فاستخدم خيار "-opw" وكلمة المرور في علامات تنصيص مفردة ، كما هو موضح أدناه. إذا كانت كلمة المرور في ملف PDF هي كلمة مرور مستخدم ، فاستخدم خيار "-upw" بدلاً من كلمة المرور.
ملاحظة: تأكد من وجود علامات اقتباس مفردة حول كلمة المرور الخاصة بك في الأمر.
pdfimages -opw 'password' -j /home/lori/Documents/SampleWithImages.pdf / home / lori / Documents / ExtractedImages / image
لمزيد من المعلومات حول استخدام الأمر pdfimages ، اكتب "pdfimages" في الموجه في نافذة Terminal واضغط على "Enter". يتم عرض استخدام الأمر مع قائمة من الخيارات المتاحة للاستخدام في الأمر.