- صاحب المنشور: كشاف الأخبار
ملخص النقاش:
تُعدّ معالجة اللُّغة الطبيعيَّة أحد المجالات الأبرز الذَّي يجمع بين التطبيقات التكنولوجية والعلوم الإنسانية. وعلى الرغم من التقدم الهام الذي حققه الذكاء الاصنَّاعي مؤخرًا فيما يتعلق بفهم وفك تشفير النصوص البشرية؛ إلا أنه لا تزال هناك العديد من العقبات والتحديات التي تعيق قدرته على تفسير المعاني الدقيقة للمحادثات والكلام اليومي بصورة دقيقة ومفصلة كالقدرة البشرية عليها.
فهم السياق والحواشي الثقافية والمعرفية العميقة
أحد أكثر المشكلات شمولاً في مجال معالجة اللغات الحاسوبي هو فهم وتعامل الآلات مع "السياق". بعبارات أبسط، يشمل هذا المصطلح القدرة على تقييم الكلمات والجمل ضمن تسلسلها الزمني والمكاني بالإضافة إلى العلاقات الخارجية الأخرى المؤثرة كنطاقات معرفية محلية أو ثقافية واسعة الانتشار والتي قد تؤدي لظهور معان مختلفة لنفس المفردات بحسب زمانها ومكانها وظروف استخداماتها المختلفة داخل المجتمع البشري الواسع.
على سبيل المثال، يمكن اعتبار كلمة desk لها دلالات متفرِّعة منها التدريس وأعمال مكتب العمل المكتبي الجاهز وحتى قطعة أثاث مكتبية ذات سطح مستوٍ. إن إدراك مدلولات هذه الكلمة وتحديد معناها الشرطي -أي ما إذا كانت تُشير مثلاً لأغراض تعليمية أم هندسية بناءً على جملة معينة- يعد مهمة شاقة بالنسبة لأنظمة NLP التقليدية نظرًا لتعدد الاستخدامات والشروح اللغوية اللازمة لفك طلاسم تلك التعابير المركبة المعجمياً والسوسيوغرافيا كذلك.
التعامل مع اللغة غير المنظَّمة والمحكية بخفة
إضافة لما سبق ذكره سابقًا حول غنى واستمرارية تحولات النظم اللغوية وتنوعها عبر التاريخ والعصور والأقاليم، نلحظ أيضًا اختلاف طرق التواصل الفموي مقارنة بالكتابي وهو الأمر الأكثر تعقيدًا لدى الآليات المحاكة افتراضيًا حيث تتضمن عملية إنتاج خطابهما نصوص كلا النوعين متفاوتتا الطابع والنبرة والإيقاع وغير ذلك مما يغيب عند ترجمة الأخير للأول مباشرة بسبب عدم وجود علامات توضيحية مثل نقاط الترقيم فتؤول حينذاك لأخطاء تأويليه ربما تكون مضلله وقد تخفي قصداً قصدي أو حتى مضامين مغلوطة نتيجة سوء تقدير للحالة الإعرابيا والصوتية الأصلين.
حلول محتملة لمجابهة العراقيل السابق ذكرها
- *العمل الجماعي المفتوح المصدر*: تعتمد تطوير تقنية البرمجيات القادرة على المناولة الصحيحة للإشارة والتعبير علي شيفرة مفتوحة المصدر وبالتالي مشاركات فاعلين متنوعي الاختصاصيات منهم متخصصو علم النفس واللسanian ومهندسو حاسب إضافة لدارس linguistics .
- *التعلم الآلي المستند إلي بيانات كبيرة *: يساهم تدريب نماذج تعلم عميقة مبنيٌّة خصيصٌّا لحالات استخراج معلومات مفصلة من مجموعات هائلة ومتشعيبة(Datasets) بأشكال وأنواع مطابقة للعينة الضرورية لإيجاد نتائج مرضية نسبيا لمنطق طبيعي حي وواقعي للغاية. مثال لهذا النهج رؤية صور تحتوي عناصر لغوية مدسوسة بطرق خفية ثم طلب تحديد ماهيتها وفق نظام مشابه للاستشعار الضوئى لكنه يعالج البيانات حسب منطلق فارسي مختلف تماما عنه المعتاد والذي يحاول تصنيف الأشياء الفيزيائية باستخدام الشبكات العصبونية الرقمية عوضاً عنها. يستخدم نموذج GPT-3 الشهير حاليًا نهجا مشابها ويتدرب حديثا أيضا بمصنف أصناف كتابية مميزة.
- *الحفاظ على خصوصية المعلومات الشخصية*: تعد مسألة أخلاقية بغاية الجدية خاصة عندما يتعلق