الصفحة الرئيسية » howto » بناء برنامج جدولة التنزيل مع مهارات البرمجة البسيطة

    بناء برنامج جدولة التنزيل مع مهارات البرمجة البسيطة

    نحن نحب جميعًا تنزيل أشياء من الإنترنت ، وهناك أكوام من أدوات إدارة التنزيل الرائعة التي يمكننا استخدامها لجدولة تنزيلاتنا. قد يكون من الأسهل استخدام مدير التنزيل ، ولكن لا ضرر في استكشاف الأدوات التي تأتي بالفعل مع أوبونتو والاستفادة الكاملة منها.

    في هذه المقالة سوف نعرض لك برنامجًا مدمجًا في Ubuntu يمكننا استخدامه لتنزيل أشياء من الإنترنت باستخدام مجلد مشترك. علاوة على ذلك سنوضح لك كيفية جدولة التنزيل باستخدام Cron.

    تحميل عن طريق Wget

    Wget هي حزمة برامج مجانية لاسترداد الملفات باستخدام HTTP و HTTPS و FTP ، وهي بروتوكولات الإنترنت الأكثر استخدامًا. إنها أداة سطر أوامر غير تفاعلي ، لذلك يمكن استدعائها بسهولة من البرامج النصية ، وظائف cron ، المطاريف بدون دعم X-Windows ، إلخ..

    افتح الجهاز الخاص بك ودعونا نستكشف كيف يمكننا استخدام wget لتحميل الأشياء من الشبكة. البنية الأساسية للتنزيل باستخدام wget هي كما يلي:

    wget [option]… [URL] ...

    سيقوم هذا الأمر بتنزيل دليل wget إلى محرك الأقراص المحلي لديك

    wget http://www.gnu.org/software/wget/manual/wget.pdf

    لينكس كرون

    يأتي Ubuntu مع برنامج cron daemon المستخدم في جدولة المهام ليتم تنفيذها في وقت معين. يسمح لك Crontab بتحديد الإجراءات والأوقات التي يجب تنفيذها فيها. هذه هي الطريقة التي تقوم بها عادة بجدولة مهمة باستخدام أداة سطر الأوامر.

    افتح نافذة طرفية وأدخل crontab -e.

    يتم فصل كل قسم من أقسام crontab بمسافة ، مع وجود القسم الأخير بمسافة واحدة أو أكثر به. يتكون إدخال cron من الدقيقة (0-59) ، ساعة (0-23 ، 0 = منتصف الليل) ، اليوم (1-31) ، الشهر (1-12) ، أيام الأسبوع (0-6 ، 0 = الأحد) ، الأمر. الإدخال الثالث في التنزيلات أعلاه crontab wget.pdf في الساعة 2 صباحًا. الإدخال الأول (0) والمدخل الثاني (2) يعني 2:00. الإدخال الثالث إلى الخامس (*) يعني أي وقت من اليوم أو الشهر أو الأسبوع. الإدخال الأخير هو أمر wget لتنزيل ملف wget.pdf من عنوان URL المحدد.

    هذا هو الأساسي في wget وكيف يعمل Cron. دعنا نأخذ مثالاً للحياة على سبيل المثال حول كيفية جدولة التنزيل.

    جدولة التحميل

    سنقوم بتنزيل برنامج Firefox 3.6 في الساعة 2 صباحًا. وبما أن مزود خدمة الإنترنت لدينا لا يقدم سوى كمية محدودة من البيانات ، نحتاج إلى إيقاف التنزيل في الساعة 8 صباحًا. هذا ما يبدو عليه الإعداد.

    تجاهل أول 2 إدخالات في crontab أعلاه. الأمر الثالث والرابع هما الأمران الوحيدان اللذان تحتاجهما. إعداد الأمر الثالث مهمة من شأنها تنزيل Firefox في الساعة 2 صباحًا:

    [الشفرة]
    0 2 * * * wget -c http://download.mozilla.org/؟product=firefox-3.6.6&os=win&lang=en-GB
    [/الشفرة]

    تشير الخيارات -c إلى أنه يجب على wget استئناف التنزيل الحالي إذا لم يكتمل.

    سيتوقف الأمر الرابع عن wget في الساعة 8 صباحًا. "Killall" هو أمر unix يقتل العمليات بالاسم.

    [الشفرة]
    0 8 * * * killall wget
    [/الشفرة]

    يقول wgetall wget أوبونتو لإيقاف wget من تنزيل الملف في 8 صباحا.

    أوامر wget مفيدة أخرى

    1. تحديد الدليل لتنزيل ملف

    [الشفرة]
    wget -output-document = / home / zainul / Downloads / wget manual.pdf http://www.gnu.org/software/wget/manual/wget.pdf
    [/الشفرة]

    يتيح لك الخيار-مستند-الإخراج تحديد الدليل واسم الملف الذي تقوم بتنزيله

    2. تحميل موقع على شبكة الانترنت

    wget قادر أيضًا على تنزيل موقع ويب.

    [الشفرة]
    wget -m http://www.google.com/profiles/zainul.franciscus
    [/الشفرة]

    سيؤدي الأمر السابق إلى تنزيل صفحة الويب الكاملة لملفي google. يخبر الخيار "-m" wget بتنزيل صورة "مرآة" لعنوان URL المحدد.

    خيار آخر مهم هو معرفة wget عدد الارتباطات التي يجب أن يتبعها عند تنزيل موقع ويب.

    [الشفرة]
    wget -r -l1 http://www.google.com/profiles/zainul.franciscus
    [/الشفرة]

    يستخدم الأمر wget أعلاه خيارين. يخبر الخيار الأول "-r" wget بتنزيل موقع الويب المحدد بشكل متكرر. يخبر الخيار الثاني "-l1" wget بالحصول على المستوى الأول فقط من الروابط من موقع الويب المحدد هذا. يمكننا إعداد ما يصل إلى ثلاثة مستويات "-l2" و "-l3".

    3. تجاهل دخول الروبوت

    يحافظ الويب الرئيسي على ملف نصي يسمى Robot.txt. تحتفظ 'Robot.txt' بقائمة من عناوين URL التي لا يجب أن يزحف إليها زاحف صفحات الويب مثل wget. يمكننا إخبار wget بتجاهل "Robot.txt" مع خيار "-erobots = off". يخبر الأمر التالي wget بتنزيل الصفحة الأولى من ملفي الشخصي في google وتجاهل 'Robot.txt'.

    [الشفرة]
    wget -erobots = off http://www.google.com/profiles/zainul.franciscus
    [/الشفرة]

    خيار مفيد آخر هو -U. سيخفي هذا الخيار wget كمتصفح. لاحظ أن إخفاء أحد التطبيقات كتطبيق آخر قد ينتهك مدة خدمة مقدم خدمة الويب.

    [الشفرة]
    wget -erobots = off -U Mozilla http://www.google.com/profiles/zainul.franciscus
    [/الشفرة]

    استنتاج

    Wget هي عبارة عن حزمة برامج قديمة جدًا يمكن استخدامها في تنزيل ملفات. Wget هي أداة سطر أوامر تفاعلية مما يعني أنه يمكننا السماح بتشغيلها على جهاز الكمبيوتر الخاص بنا في الخلفية دون الحاجة إلى بدء أي تطبيق. تحقق من صفحة رجل wget

    [الشفرة]
    $ رجل wget
    [/الشفرة]

    لفهم الخيارات الأخرى التي يمكننا استخدامها مع wget.

    الروابط

    دليل Wget
    كيفية الجمع بين اثنين من تحميل الملفات عندما يفشل wget في منتصف الطريق
    Linux QuickTip: التنزيل وإلغاء الربط في خطوة واحدة