الصفحة الرئيسية » howto » أليكسا وسيري وجوجل لا تفهم كلمة تقولها

    أليكسا وسيري وجوجل لا تفهم كلمة تقولها

    الأمازون

    لقد قطعت مساعدين صوت مثل Alexa و Google Assistant و Siri شوطا طويلا في السنوات القليلة الماضية. ولكن ، على الرغم من كل التحسينات التي قاموا بها ، يعيدهم شيء واحد: فهم لا يفهمونك. يعتمدون كثيرًا على أوامر صوتية محددة.

    التعرف على الكلام هو مجرد خدعة سحرية

    الأمازون

    المساعدين الصوتيين لا يفهمونك. ليس حقا ، على أي حال. عندما تتحدث إلى Google Home أو Amazon Echo ، فإنها تقوم بتحويل كلماتك إلى سلسلة نصية ثم تقارنها بالأوامر المتوقعة. إذا وجد تطابقًا تامًا ، فإنه يتبع مجموعة من الإرشادات. إذا لم يحدث ذلك ، فإنه يبحث عن بديل لما يجب فعله استنادًا إلى المعلومات المتوفرة لديه ، وإذا لم ينجح ذلك ، فستحصل على رسالة فاشلة مثل "أنا آسف ، لكنني لا أعرف ذلك "إنها أكثر من مجرد خفة من سحر اليد لخداعك إلى تفكيرك.

    لا يمكن استخدام أدلة سياقية لجعل أفضل تخمين ، أو حتى استخدام فهم لموضوعات مماثلة لإعلام قراراتها. ليس من الصعب القيام بمساعد صوتي إما. في حين يمكنك أن تسأل أليكسا "هل تعمل لدى وكالة الأمن القومي؟" والحصول على إجابة ، إذا سألت "هل أنت جزء من وكالة الأمن القومي سرا؟" تحصل على رد "أنا لا أعرف ذلك واحد" (على الأقل في وقت هذه الكتابة).

    البشر ، الذين يفهمون الكلام بصدق ، لا يعملون هكذا. لنفترض أنك سألت إنسانًا ، "ما هذا هو klarvain في السماء؟ الذي يتقوس ، ومليء بالألوان المخططة مثل الأحمر والبرتقالي والأصفر والأزرق ". على الرغم من أن كلمة klarvain هي كلمة مكونة ، فإن الشخص الذي سألته ربما يعرف من السياق أنك تصف قوس قزح.

    في حين يمكنك القول إن الإنسان يحول الكلام إلى أفكار ، يمكن للإنسان بعد ذلك تطبيق المعرفة والفهم لإبرام إجابة. إذا سألت إنسانًا إذا كان يعمل سراً مع وكالة الأمن القومي ، فسوف يعطيك إجابة بنعم أو لا ، حتى لو كانت تلك الإجابة كذبة. لن يقول إنسان "لا أعرف هذا الشخص" لسؤال كهذا. يمكن للبشر أن يكذب هو شيء يأتي بفهم حقيقي.

    المساعدين الصوتيين لا يمكنهم تجاوز برمجةهم

    يقتصر المساعدين الصوتيين في نهاية المطاف على المعلمات المتوقعة المبرمجة ، والتجول خارج منهم سوف يكسر العملية. تُظهر هذه الحقيقة عند تشغيل الأجهزة التابعة لجهات خارجية. عادة ، الأمر للتفاعل مع تلك غير عملي للغاية ، يرقى إلى "أخبر الشركة المصنعة للجهاز بإعطاء حجة اختيارية." مثال دقيق هو: "أخبر ويرلبول لإيقاف المجفف". لتذكر أكثر صعوبة ، جين أليكسا المهارات تسيطر على بعض أفران GE. يحتاج مستخدم المهارة إلى أن يتذكر "أخبر جنيف" وليس "أخبر جنرال إلكتريك" ثم بقية الأمر. وبينما يمكنك طلب تسخين الفرن إلى 350 درجة ، لا يمكنك المتابعة مع طلب زيادة درجة الحرارة بمقدار 50 درجة أخرى. يمكن أن يتبع الإنسان هذه الطلبات بالرغم من ذلك.

    عملت Amazon و Google بجد للتغلب على هذه العقبات ، وهذا واضح. عندما تضطر إلى اتباع التسلسل السابق للتحكم في القفل الذكي ، يمكنك الآن قول "قفل الباب الأمامي" بدلاً من ذلك. اعتاد أليكسا أن يخلط بينه وبين "أخبرني نكتة كلب" ، لكن اسأل عن أحدهم اليوم ، وسيعمل. لقد أضافوا تنويعات للأوامر التي تستخدمها ، ولكن في النهاية لا يزال يتعين عليك معرفة الأمر الصحيح للقول. تحتاج إلى استخدام الصيغة الصحيحة ، بالترتيب الصحيح.

    وإذا كنت تعتقد أن هذا يبدو وكأنه سطر أوامر ، فأنت لست مخطئًا.

    المساعدين الصوتيين عبارة عن سطر أوامر فاخر

    يتم تعريف سطر الأوامر بشكل ضيق لتنفيذ المهام البسيطة ، ولكن فقط إذا كنت تعرف البنية الصحيحة. إذا انزلقت من هذا النحو الصحيح واكتبت dyr بدلاً من dir ، فسوف يعطيك موجه الأوامر رسالة خطأ. يمكنك استخدام الأسماء المستعارة لتسهيل تذكر الأوامر ، ولكن يجب عليك معرفة ما هي الأوامر الأصلية وكيفية عملها وكيفية استخدام الأسماء المستعارة بكفاءة. إذا كنت لا تأخذ من الوقت لتعلم خصوصيات وخارج سطر الأوامر ، فلن تحصل على الكثير من ذلك.

    المساعدين الصوتي لا يختلفون. أنت في حاجة لمعرفة الطريقة الصحيحة لقول أمر أو طرح سؤال. وتحتاج إلى معرفة كيفية إعداد مجموعات لـ Google و Alexa ، وسبب أهمية تجميع أجهزتك ، وكيفية تسمية أجهزتك الذكية. إذا كنت لا تتبع هذه الخطوات الضرورية ، فسوف تشعر بالإحباط من أن تطلب من مساعد الصوت الخاص بك إيقاف الدراسة فقط ليتم طرحها ، "يجب إيقاف الدراسة".

    حتى عند استخدام بناء الجملة الصحيح بالترتيب الصحيح ، قد تفشل العملية. إما مع إصدار استجابة خاطئة أو نتيجة مفاجئة. قد يمنحك اثنان من Google Homes في نفس المنزل الطقس لمواقع مختلفة قليلاً على الرغم من أنه يمكن الوصول إلى نفس معلومات حساب المستخدم واتصال الإنترنت.

    في المثال أعلاه ، يتم إعطاء الأمر "تعيين مؤقت لمدة نصف ساعة". أنشأ محوّل Google Home مؤقتًا باسم "الساعة" ، ثم سئل عن المدة التي يجب أن يستغرقها الموقت. وبعد تكرار نفس الأمر ثلاث مرات أخرى عملت بشكل صحيح وإنشاء جهاز توقيت 30 دقيقة. يعمل استخدام الأمر "تعيين مؤقت لمدة 30 دقيقة" بشكل صحيح على أساس أكثر تناسقًا.

    على الرغم من أن التحدث إلى Google Home أو Echo قد يكون أكثر مرونة ، إلا أن المساعدين الصوتيين وخطوط الأوامر تعمل بنفس الطريقة. قد لا تحتاج إلى تعلم لغة جديدة ، لكنك بحاجة إلى تعلم لهجة جديدة.

    الفهم الضيق لمساعدي الصوت سيحد من النمو

    لا شيء من هذا يمنع المساعد الصوتي مثل مساعد Google و Alexa من العمل بشكل جيد (على الرغم من أن Cortana هي قصة مختلفة). مساعد Google و Alexa والبحث عبر الإنترنت عن الأسئلة بشكل لائق ، ولكن ليس من المستغرب أن Google أفضل في البحث ، ويمكنه الإجابة عن الأسئلة الأساسية مثل التحويلات القياسية والرياضيات البسيطة. مع المنزل الذكي الذي تم إعداده بشكل صحيح والمستخدم المدربين بشكل جيد ، فإن معظم أوامر المنزل الذكي تعمل على النحو المنشود. لكن هذا جاء من خلال العمل والجهد ، وليس الفهم الذهني.

    كانت الموقتات وأجهزة الإنذار مبسطة. مع مرور الوقت تم إضافة تسمية ، ثم القدرة على إضافة الوقت إلى جهاز توقيت. انتقلوا من التبسيط إلى التعقيد. يمكن للمساعدين الصوتيين الإجابة عن مزيد من الأسئلة ، ويجمع كل يوم مهارات ومزايا جديدة. لكن هذا ليس نتاج النمو الذاتي الذي يأتي من التعلم والفهم.

    ولا شيء من ذلك يسلم القدرة المتأصلة على استخدام ما هو معروف للوصول إلى المجهول. لكل الأوامر والأسئلة التي تعمل ، سيكون هناك دائمًا ثلاثة أشياء لا تفعل ذلك. بدون انفراج في A.I. التي تمنح قدرة شبيهة بالإنسان على الفهم ، المساعدين الصوتيين ليسوا مساعدين على الإطلاق. إنها مجرد أوامر صوتية مفيدة في السيناريو الصحيح ولكنها تقتصر على تلك السيناريوهات التي تمت برمجتها لفهمها.

    وبعبارة أخرى: الآلات هي تعلم الأشياء ، ولكن لا يمكن فهمها.