الصفحة الرئيسية » howto » كيفية تحويل ملف PDF إلى نص قابل للتحرير باستخدام سطر الأوامر في لينكس

    كيفية تحويل ملف PDF إلى نص قابل للتحرير باستخدام سطر الأوامر في لينكس

    هناك العديد من الأسباب التي قد تجعلك ترغب في تحويل ملف PDF إلى نص قابل للتحرير. ربما تحتاج إلى مراجعة مستند قديم وكل ما لديك هو نسخة PDF منه. يعد تحويل ملفات PDF في Windows أمرًا سهلاً ، ولكن ماذا لو كنت تستخدم نظام التشغيل Linux?

    لا داعى للقلق. سنوضح لك كيفية تحويل ملفات PDF بسهولة إلى نص قابل للتحرير باستخدام أداة سطر الأوامر تسمى pdftotext ، وهي جزء من حزمة "poppler-utils". قد تكون هذه الأداة مثبتة بالفعل. للتحقق من تثبيت pdftotext على نظامك ، اضغط على "Ctrl + Alt + T" لفتح نافذة طرفية. اكتب الأمر التالي في الموجه واضغط على "أدخل".

    dpkg -s poppler-utils

    ملاحظة: عندما نقول لكتابة شيء ما في هذه المقالة وهناك اقتباسات حول النص ، لا تكتب علامات الاقتباس ، ما لم نحدد خلاف ذلك.

    إذا لم يتم تثبيت pdftotext ، فقم بكتابة الأمر التالي في الموجه واضغط على "Enter".

    sudo apt-get install poppler-utils

    اكتب كلمة المرور الخاصة بك عند مطالبتك واضغط على "أدخل".

    هناك العديد من الأدوات المتاحة في حزمة poppler-utils لتحويل PDF إلى صيغ مختلفة ، والتلاعب بملفات PDF ، واستخراج المعلومات من الملفات.

    فيما يلي الأمر الأساسي لتحويل ملف PDF إلى ملف نصي قابل للتحرير. اضغط على "Ctrl + Alt + T" لفتح نافذة طرفية ، واكتب الأمر في الموجه ، واضغط على "Enter".

    pdftotext /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    قم بتغيير المسار إلى كل ملف لمطابقة اسم واسم ملف PDF الأصلي والمكان الذي تريد حفظ الملف النصي الناتج فيه. أيضا ، قم بتغيير أسماء الملفات لتتوافق مع أسماء ملفاتك.

    يتم إنشاء الملف النصي ويمكن فتحه تمامًا مثلما تقوم بفتح أي ملف نصي آخر في Linux.

    قد يحتوي النص المحول على فواصل أسطر في أماكن لا تريدها. يتم إدخال فواصل الأسطر بعد كل سطر من النص في ملف PDF.

    يمكنك الاحتفاظ بتنسيق المستند (الرؤوس والتذييلات والترحيل ، وما إلى ذلك) من ملف PDF الأصلي في الملف النصي المحول باستخدام علامة "-layout".

    pdftotext -layout /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    إذا كنت تريد فقط تحويل نطاق من الصفحات في ملف PDF ، فاستخدم علامتي "-f" و "-l" (علامة صغيرة "L") لتحديد الصفحات الأولى والأخيرة في النطاق الذي تريد تحويله.

    pdftotext -f 5 -l 9 /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    لتحويل ملف PDF محمي ومشفر باستخدام كلمة مرور مالك ، استخدم علامة "-opw" (الحرف الأول في العلم هو حرف صغير "O" ، وليس صفراً).

    pdftotext -opw "password" /home/lori/Documents/Sample.pdf /home/lori/Documents/Sample.txt

    قم بتغيير "كلمة المرور" إلى تلك المستخدمة لحماية ملف PDF الأصلي الذي يتم تحويله. تأكد من وجود علامات اقتباس مفردة ، وليس مزدوجة ، حول "كلمة المرور".

    إذا كان ملف PDF محميًا ومشفّرًا باستخدام كلمة مرور مستخدم ، فاستخدم علامة "-upw" بدلاً من علامة "-opw". ما تبقى من الأمر هو نفسه.

    يمكنك أيضًا تحديد نوع حرف نهاية السطر الذي يتم تطبيقه على النص المحول. هذا مفيد بشكل خاص إذا كنت تخطط للوصول إلى الملف على نظام تشغيل مختلف مثل Windows أو Mac. للقيام بذلك ، استخدم علامة "-yol" (الحرف الأوسط في العلامة هو حرف صغير "O" ، وليس صفراً) متبوعاً بمسافة ونوع حرف نهاية السطر الذي تريد استخدامه (" unix "أو" dos "أو" mac ").

    ملاحظة: إذا لم تقم بتحديد اسم ملف للملف النصي ، فسيستخدم pdftotext قاعدة اسم ملف PDF ويضيف امتداد ".txt" تلقائيًا. على سبيل المثال ، سيتم تحويل "file.pdf" إلى "file.txt". إذا تم تحديد الملف النصي على أنه "-" ، يتم إرسال النص المحول إلى stdout ، مما يعني أنه يتم عرض النص في النافذة الطرفية ولا يتم حفظه في ملف.

    لإغلاق النافذة الطرفية ، انقر فوق الزر "X" في الزاوية العلوية اليسرى.

    لمزيد من المعلومات حول الأمر pdftotext ، اكتب "صفحة pdftotext للرجل" في الموجه في نافذة طرفية.