الذكاء الاصطناعي يدرس تغريدات الشباب من أجل فهم أعمق للغة البشر

كلام وعر

يبدو أن اكتشاف المعاني الضمنية للكلام الدراج والعامي والأخطاء الإملائية المقصودة أحد أكبر عقبات الذكاء الاصطناعي في معالجة اللغات، ما دفع فريقًا من علماء الرياضيات في جامعة فيرمونت الأمريكية إلى البدء بتحليل مدِّ الشباب للكلمات عامدين عند الكتابة، وحددوا الفرق في المعنى بين «مرحبًا» و«مرحبااااااااااااا» آملين أن تتعلم خوارزميات الذكاء الاصطناعي كيف تفهم أساليب حديثنا غير الرسمي عبر الإنترنت.

معانٍ خفية

ونشر الفريق بحثه في مجلة بلوس ون الأمريكية، في 27 مايو/أيار 2020، وحللوا كلمات قابلة للمد، ظهرت في 100 مليار تغريدة، نُشِرت في الأعوام الثمانية الأخيرة، ليتوصلوا إلى نوعين من القياس؛ التوازن والتمدد. مثلًا؛ لفظة «لالالالالالالالا» لها قيمة توازن عالية، بينما كلمة «لاااااااااااا» كررت حرفًا واحدًا فقط.

وتساعد النتائج خوارزميات الذكاء الاصطناعي والمؤرخين في المستقبل في فهم كلمات بعينها؛ فعلى سبيل المثال تشير جملة «يا رجل» إلى الشخص المُخاطَب، وفي المقابل توحي جملة «يااااا رجللللل» التي نستخدمها أحيانًا في محادثاتنا غير الرسمية، إلى معاني الاستهجان والاستغراب.

تحديث المعجم

ويرى الباحثون أن القواميس لا تعكس طريقة حديث البشر الحقيقية، معتبرين أن فهم الكلمات القابلة للمدِّ المنتشرة على مواقع التواصل الاجتماعي، يسد فجوة معرفية مهمة.

وقال الباحثون «جمعنا وأحصينا بشكل شامل الكلمات القابلة للمد، ووضعنا لها خريطة ثنائية الأبعاد، بمحورين؛ التوازن والتمدد، مع تطوير أدوات جديدة ستساعدنا في دراستنا اللغوية وفي مجالات أخرى؛ مثل معالجة لغة تطوير القواميس، وتحسين محركات البحث، وغيرها.»

المصدر

شاهد أيضاً