في عالم تتزايد فيه حدة التفاعلات الرقمية يومًا بعد آخر، لم يعد التنمر الإلكتروني مجرد سلوك عابر على منصات التواصل، بل تحول إلى تهديد نفسي واجتماعي واسع التأثير، خصوصًا بين الشباب والمراهقين. وبينما تتطور أدوات الإساءة عبر الإنترنت، يسعى الباحثون إلى تطوير أدوات أكثر ذكاءً لفهم هذا المحتوى ورصده قبل أن يتحول إلى أذى حقيقي.
وفي هذا السياق، نجح فريق بحثي من جامعتي الفيوم والقاهرة في تطوير نموذج يعتمد على تقنيات الذكاء الاصطناعي ومعالجة اللغة الطبيعية لرصد التنمر الإلكتروني باللغة العربية، مع تركيز خاص على اللهجة المصرية التي تُعد من أكثر اللهجات استخدامًا على شبكات التواصل الاجتماعي.
الدراسة التي أعدتها الباحثات إيمان حسن النشار، وفوزية رمضان سيد، وفاطمة عبد الله عمارة، اعتمدت على تحليل أكثر من 9 آلاف منشور وتعليق ورسالة جُمعت من منصات مثل فيسبوك وتويتر وإنستغرام، بهدف تدريب أنظمة تعلم آلي على فهم اللغة العامية المصرية واكتشاف العبارات المسيئة بدقة عالية.
ما يلفت الانتباه في الدراسة أن الباحثين لم يكتفوا بالتصنيف التقليدي الذي يقسم المحتوى إلى “تنمر” و”غير تنمر”، بل طوروا نموذجًا أكثر تفصيلًا قادرًا على التمييز بين 16 نوعًا مختلفًا من التنمر الإلكتروني، من بينها التنمر الديني والسياسي والجسدي والعاطفي والأكاديمي والاقتصادي والأسري والثقافي. ويمنح هذا التصنيف الدقيق الأنظمة الذكية قدرة أكبر على فهم طبيعة الإساءة وسياقها بدلًا من الاكتفاء برصد الكلمات العدائية المباشرة.
كيف تفهم الآلة اللهجة المصرية؟
اعتمد الفريق البحثي على تقنيات “معالجة اللغة الطبيعية” أو NLP، وهي مجموعة من الأدوات التي تسمح للحواسيب بتحليل اللغة البشرية وفهمها. وخلال عملية التدريب، جرى تنظيف النصوص من الروابط والرموز والكلمات غير المهمة، مع توحيد الصيغ اللغوية والتعامل مع الاختلافات الشائعة في الكتابة العامية المصرية.
وتوضح الدراسة أن النظام خضع لسلسلة طويلة من عمليات المعالجة، شملت تقسيم الجمل إلى كلمات، وإزالة الأرقام وعلامات الترقيم والوسوم والروابط الإلكترونية، ثم تحويل النصوص إلى بيانات يمكن للخوارزميات التعامل معها وتحليلها.
ولتحليل المحتوى، اختبر الباحثون خمس خوارزميات مختلفة من التعلم الآلي، أبرزها خوارزمية “آلة المتجهات الداعمة” المعروفة اختصارًا بـ SVM، إلى جانب الانحدار اللوجستي والغابات العشوائية ونايف بايز والجيران الأقرب.
تفوق خوارزمية واحدة
أظهرت النتائج تفوق خوارزمية SVM بشكل واضح، بعدما حققت دقة بلغت 95.5% في اكتشاف التنمر الإلكتروني، متقدمة على بقية النماذج المستخدمة. كما أظهرت النتائج قدرة مرتفعة على اكتشاف بعض أنواع الإساءة مثل التنمر المرتبط بالعمر أو الدين أو الحالة الاجتماعية.
ويرجع الباحثون هذا التفوق إلى قدرة الخوارزمية على التعامل مع النصوص المعقدة والمليئة بالتعبيرات غير الرسمية التي تميز اللهجة المصرية على الإنترنت، خصوصًا أن كثيرًا من التعليقات المسيئة تعتمد على التلميحات أو السخرية أو السياق الثقافي أكثر من اعتمادها على الكلمات المباشرة.
لكن النموذج لم يكن مثاليًا بالكامل؛ إذ واجه صعوبة أكبر في اكتشاف بعض الأنماط مثل التنمر الأسري والثقافي، ويربط الباحثون ذلك بندرة البيانات المتاحة لهذه الفئات مقارنة بالأنواع الأخرى من الإساءة الإلكترونية.
أبعد من مجرد كشف الإساءة
تكمن أهمية هذا النوع من الأبحاث في أنه قد يشكل الأساس لأنظمة ذكية قادرة مستقبلًا على مراقبة المحتوى المسيء بشكل لحظي داخل منصات التواصل الاجتماعي، أو دعم أدوات الإشراف الرقمي المستخدمة في المدارس والمؤسسات والمنصات الرقمية.
كما تشير الدراسة إلى أن تطوير مثل هذه الأنظمة لا يتعلق فقط بالدقة التقنية، بل يتطلب أيضًا مراعاة قضايا الخصوصية وتجنب الرقابة المفرطة أو إساءة استخدام أدوات الرصد الآلي.
ويأمل الفريق البحثي مستقبلًا في تطوير أنظمة تعمل في الزمن الحقيقي لرصد التنمر فور نشره، إلى جانب استخدام نماذج لغوية أعمق تعتمد على تقنيات “المحوّلات” أو Transformers لفهم الأنماط اللغوية المعقدة والسخرية والسياقات الضمنية بصورة أفضل.
Yemen Science يمن ساينس: الشبكة اليمنية للعلوم والبيئة، موقع يهتم بأخبار العلوم والتكنولوجيا والصحة والبيئة والسكان
